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(57) Abstract: The invention relates to a system for expressing toxic proteins, an expression vector comprising the aforementioned 
system, a prokaryote cell transformed by the system and a method of synthesising a toxic protein using said expression system. Said 
expression system is characterised in that it comprises the following successive sequences in direction 5*3', namely a nucleotide 
sequence coding for dipeptide Asp-Pro and a nucleotide sequence coding for a toxic protein. In a particularly preferable mode, 
the expression system also comprises, upstream of the Asp-Pro sequence, a nucleotide sequence coding for a soluble protein. The 
inventive expression system can be used to construct an expression vector which can be used to transform a prokaryote cell such as 
E. coli, e.g. in a toxic protein synthesis method. 

(57) Abrege : La prSsente invention se rapporte a un systeme d'expression de prolines toxiques, a un vecteur d'expression com- 
prenant ce systeme, a une cellule procaryote transformee par ce systeme, ainsi qu'a un procetle* de synthese d'une proline toxique 
utilisant ce systeme d'expression. Le systeme d'expression de Tinvention se caracterise en ce qu'il comprend successivement, dans 
le sens 5'-3\ une sequence nucl6otidique codant pour le dipeptide Asp-Pro et une sequence nucteotidique codant pour une protSine 
toxique. Selon un mode particulierement pr6fer6 de Tinvention, le systeme d'expression comprend en outre, en amont de la sequence 
Asp-Pro, une sequence nucleotidique codant pour une proline soluble. Le systeme d'expression de Tinvention permet de construire 
un vecteur d*expression utile pour la transformation d'une cellule procaryote telle que E. coli, par exemple dans un proceed de syn- 
these de la proteme toxique. 
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SYSTEMES D' EXPRESSION DE PROTEINES TOXIQUES , VECTEURS 
ET PROCEDE DE FABRICATION DE PROTEINES TOXIQUES 

DESCRIPTION 

5 DOMAINS TECHNIQUE 

La presente invention se rapporte a des 
syst^mes d' expression de proteines toxiques, k des 
vecteurs d' expression comprenant un de ces systemes, a 
des cellules procaryotes transformees par ces systemes, 
10 ainsi qu' k un proc^de de synthase d'une proteine 
toxique iitilisant ces systemes d' expression. 

Elle permet par exemple la surproduction dans 
une cellule procaryote, par exemple Escherichia coll 
(E.coli), de proteines ou peptides hydrophobes 
15 toxiques, par exemple la surproduction de domaines 
transmembranaires de proteines d'enveloppe de virus. 

Elle trouve de nombreuses applications 
notamment dans la recherche concernant les mecanismes 
d' infections virales et dans recherche et la mise.au 
20 point de nouveaux principes actifs pour lutter contre 
les infections virales. 

Dans la description qui suit, les references 
entre crochets [ ] renvoient a la liste de references 
annex6e . 

25 

Etat de la technique 

La determination de la structure 

tridimensionnelle (3D) est une etape decisive dans la 
comprehension structurale et f onctionnelle des 
30 proteines. 
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De tres grands efforts et moyens ont ete, et 
sont, mis en oeuvre pour parvenir a ce but, et se sont 
amplifies avec 1' accumulation des donnees apportees par 
les programmes de sequengage des genomes [1] . 
5 Les deux principales techniques permettant 

1' 6tablissement de ces structures des proteines sont la 
diffraction des rayons X, realisee a partir de 
proteines cristallisees, et la resonance magnet ique 
nucleaire (RMN) effectuee a partir de proteines en 
10 solution. La RMN, bien adaptfee a 1' etude de proteines 
de masse mol6culaire inferieure A 20 kDa, necessite 
cependant, comme la diffraction des RX, la production 
de grandes quantites de materiel. Elle implique en 
outre dans la plupart des cas de preparer du materiel 
15 enrichi en 15 N et/ou 13 C. 

Dans ce contexte, la bact§rie est un moyen de 
production largement utilise par la communaute 
scientifique [2] . La surexpression de proteines dans la 
bacterie ne s'effectue cependant pas sans probl^mes. En 
20 effet, elle donne lieu & trois cas de figures : 

Le premier cas, ideal, est celui oCi la 
prot^ine est surproduite sous une forme correctement 
repliee dans l'espace lors de sa synthase in vivo. Ce 
n'est pas une situation rare, mais elle n'est pas 
25 frequente non plus. Elle concerne essentiellement les 
prot6ines solubles et. de taille r^duite, c'est a dire 
d' environ 20 k 50 kDa. 

Le deuxieme cas, le plus courant, est celui 
oil la proteine est surproduite et agreg^e sous la forme 
30 de corps d' inclusion. Cela concerne les proteines 
polytopiques et/ou de grande taille. Dans ce cas, la 
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cinetique de repliement de la prot&ine est nettement 
plus lente que sa vitesse de biosynth^se . Cela favorise 
1' exposition au solvant aqueux des regions hydrophobes 
de la proteine qui sont normalement enfouies au coeur 
5 de celle-ci, et genere des interactions non specif iques 
qui conduisent a la formation d' agregats insolubles. 
Suivant le degre de desordre de ce repliement , les 
corps d' inclusions peuvent §tre solubilis§s/deplies 
dans des conditions non natives, avec de l'uree ou de 
10 la guanidine. La proteine solubilisee est ensuite 
soumise k diff6rents traitements comme la dialyse ou la 
dilution pour favoriser, dans certains cas avec succes, 
un repliement 3D natif . 

Le troisifeme cas est ceiui ou 1' expression 
15 engendre une toxicite d'un degre variable . Celui-ci va 
de 1' absence de produit d' expression si la bacterie 
parvient a s' adapter, a la mort de celle-ci si le 
produit est trop toxique. C est un cas qui se presente 
assez frequemment et le plus souvent avec des proteines 
20 ou des domaines de proteines membranaires, comme par 
exemple ceux des proteines d' enveloppe du virus de 
1' hepatite C [5] ou du virus d' immunodef icience humain 
[6] .. 

Le probleme de toxicity concerne 

25 essentiellement 1' expression de proteines membranaires, 
c' est k dire de proteines presentant un domaine 
hydrophobe. Or ces proteines pr6sentent un interet 
grandissant. Elles sont d' une part relativement 
nombreuses puisque 1' etablissement des differents 
30 genomes confirme qu' elles representent environ 30% des 
proteines potent iellement codees par ces genomes [7] . 
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Elles constituent d' autre part 70% des cibles 
therapeutiques et leur alteration est a l'origine de 
nombreuses maladies g§netiques [8] . 

II est done essentiel de mettre au point des 
5 methodes facilitant ou permettant 1' expression de 
telles proteines ou de leur partie membranaire. 

Des efforts ont ete faits dans ce sens avec par 
exemple la mise au point de souches bacteriennes, y soit 
tolerant mieux l f expression de proteines membranaires 
10 [9/ 10], soit ayant une regulation plus stricte du 
mecanisme d' expression comme dans . le cas de la souche 
E. coli BL21 (DE3)pLysS d6veloppee par Stratagene. 
Cependant, ces ameliorations ne permettent pas de 
supprimer le phenomene de toxicite dans tous les cas, 
15 en particulier lors de 1' expression de peptides 
hydrophobes correspondant a des ancres membranaires. 

L'un des enjeux medicaux majeurs actuels 
concerne le traitement de 1' hepatite C. Celle-ci est 
provoqu6e par le virus de 1' hepatite C (VHC) de la 
20 famille des flaviviridae et qui infecte specif iquement 
les cellules hepatiques [11] • Ce virus est constitu6 
d'un ARN positif d' environ 9500 bases qui code pour une 
polyproteine de 3033 r^sidus [13], symbolise sur la 
figure 1 annex6 par le rectangle 1A. Cette polyproteine 
25 est clivee aprds expression par des proteases endogenes 
et exog^nes pour donner naissance & 10 proteines 
diff^rentes. Deux d'entre elles, appelees El et E2, 
sont glycosylees et forment l'enveloppe du virus. Elles 
possddent chacune des domaines membranaires appel6s TM, 
30 en particulier TME1 pour la proteine El et TME2 pour la 
prot^ine E2 . Les positions de clivage qui les generent 



WO 2004/027068 




7FR2003/002763 



5 

sont indiquees sur la figure 1 par des fleches avec, 
mentionne au-dessous, un nombre qui correspond a la 
position dans la polyproteine du premier acide amin6 de 
sequence resultant du clivage. Les proteines El et . E2 
5 sont symbolisees par un rectangle. La partie blanche de 
chaque rectangle correspond a 1 ' ectodomaine (ed) et la 
partie grisee a la region transmembranaire (TM) . La 
sequence primaire des TM est indiqu6e dans le bas de la 
figure en code k une lettre, avec des nombres 
10 correspondant ci la position des acides amines dans la 
polyproteine. situes aux extr6mites de ces domaines. Les 
etoiles indiquent les acides amines hydrophobes- Ces 
domaines membranaires ou regions membranaires du virus 
ont des propriet^s d' association particulieres qui 
15 conditionnent la structuration de l'enveloppe du virus 
[12] . A ce titre, ils constituent des cibles 
therapeutiques potentielles . La comprehension du 
mecanisme d' association du virus necessite des etudes 
de la structure 3D de ces domaines notamment par les 
20 techniques pr§citees, ce qui implique de produire ces 
peptides en quantite abondante , et en plus de 
preference par voie biosynthetique pour permettre un 
marquage isotopique 15 N et/ou 13 C. 

Les diff6rents essais d' expression de El de 
25 l'.art anterieur, notamment dans E. coli [14] [5] ou dans 
des cellules d' insecte sf9 infect ees par baculovirus 
[15] , n'ont pas permis de surproduire cette proteine 
El f notamment du fait de la toxicite induite par son 
expression/ y compris dans les souches E. coli 
30 BL21 (DE3) pLysS dites « resistantes » decrites ci- 
dessus. II n'y a pas eu d'essai de surexpression de la 
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proteine E2 dans la bacterie. Ces problemes de toxicite 
sont essentiellement dus & la region C-terminale des 
deux proteines, riche en acides amines hydrophobes qui 
forment des domaines t ransmembr ana ires assurant 
5 l'ancrage a la membrane du reticulum endoplasmique . 

II existe done un reel besoin pour un systeme 
d' expression de proteines toxiques qui ne presente pas 
les inconvenients, limitations, defauts et desavantages m 
des techniques de l'art ant6rieur. 

10 En outre, il existe un reel besoin d'un vecteur 

d' expression comprenant un tel systeme d' expression de 
proteines toxiques permettant de mettre en ceuvre un 
precede de fabrication de proteines toxiques qui ne 
presente pas les inconvenients, limitations, defauts et 

15 d§savantages des techniques de l'art anterieur. 

EXPOSE DE ls r INVENTION 

Le but de la presente invention est precisement 
de fournir un systdme d' expression d' une proteine 
20 toxique, qui reponde, entre autres, aux besoins 
indiqu6s ci-dessus • 

Ce but, et d r autres encore, sont atteints, 
conformement a 1' invention, par un systeme d' expression 
caracterise en ce qu' il comprend successivement, dans 
25 le sens 5' -3', une sequence nucl6otidique codant pour 
le dipeptide Asp-Pro, appelee ci-dessous sequence dp, 
et une sequence nucleotidique (pt) codant pour une 
proteine toxique (Pt) . Ce systeme sera identifie ci- 
dessous par : dp-pt. 
30 Selon un mode particulierement pref6re de la 

presente invention, le systeme d' expression comprend en 
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outre, en amont de la sequence dp, une sequence 
nucl£otidique (ps) codant pour une proteine soluble 
(Ps) . Cette proteine soluble peut etre par exemple la 
glutathion S-transf erase (GST) ou la thioredoxine (TrX) 
5 ou une autre proteine soluble equivalente . Ce systeme 
d' expression selon 1' invention sera identifie ci- 
dessous par : ps-dp-pt. 4 

Le systeme d' expression dp-pt de la presente 
invention, qui comprend une sequence codant pour Asp- 

10 Pro (DP en code & une lettre) placee en amont de la 
sequence nucl6otidique de la proteine toxique, permet 
de maniere tout & fait inattendue de supprimer l'effet 
toxique de la proteine pour la cellule hote. En outre, 
les inventeurs ont note que, de maniere tout a fait 

15 surprenante, la suppression de toxicite de la proteine 
chez I'hote est encore plus efficace avec le systeme 
d' expression ps-dp-pt, lorsque le peptide toxique est 
produit en fusion C-terminale avec une proteine 
soluble, par exemple la glutathion S-transf erase ou la 

20 thioredoxine, avec la sequence Asp-Pro inser^e entre la 
proteine soluble et le peptide toxique, 

Le systeme d' expression dp-pt ou ps-dp-pt de la 
pr§sente invention permet la surproduction de proteines 
toxiques dans des cellules hotes, en particulier de 

25 proteines hydrophobes, notamment de peptides qui 
correspondent a, ou qui comprennent, des domaines 
hydrophobes de proteines ancrees aux membranes. II peut 
s'agir par exemple d'une proteine membranaire ou un 
domaine d'une proteine membranaire. II peut s'agir par 

30 exemple d'une proteine d'un virus, par exemple d'un 
virus de 1' hepatite C,d'un virus du sida, ou de tout 
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autre virus pathogene pour l'humain et de maniere 
g^nerale pour les mammif eres . 

Par exemple, le systeme dp-pt ou ps-dp-pt de 
1' invention permet de surproduire chez un hote tel que 
5 E.coli les domaines transmembranaires des proteines El 
et E2 du virus de 1' hepatite C, appelees TME1 et TME2, 
correspondant respectivement aux sequences : 

TME1 : 347-MIAGAHWGVLAGiAYFSMVGNWAKVLVVLLLFAGVDA-383 
10 Sequence IDn°l 

TME2 : 717 -ME YVVLLFLLLADARVCSCLWMMLLI SQAEA- 74 6 

Sequence IDn°2 

15 alors que cela n'6tait pas possible avec les 

techniques de 1'art anterieur. 

Les sequences nucleotidiques utilisables pour 
constituer le systeme dp-pt de 1' invention codant pour 
les proteines TME1 ( dp-pt (T MEi) ) ou TME2 ( dp-pt < T me2> ) 

20 peuvent etre toutes les sequences possibles codant 
respectivement pour les prot§ines de fusion DP-TME1 et 
DP-TME2. Les sequences codant pour les proteines TME1 
et TME2 peuvent etre par exemple, avantageusement, 
respectivement , des sequences IDn°3 et IDn°4 de la 

25 liste de sequences annexee . Pour obtenir le systeme 
dp-pt la sequence dp codant pour le dipeptide Asp-Pro 
(DP) est ajoutee & ces sequences. 

Les sequences nucleotidiques utilisables pour 
constituer le systeme ps-dp-pt de 1' invention codant 

30 pour les proteines TME1 {ps-dp-pt (T med ) ou TME2 {ps-dp- 
p t (tme2 ) ) peuvent etre toutes les sequences possibles 
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codant respectivement pour les prot6ines de fusion Ps- 
DP-TME1 et Ps-DP-TME2. II peut s'agir par exemple, 
avantageusement, des sequences IDn°34, IDn°35 et IDn°3 6 
de la liste de sequences annexee pour TME1, permettant 
5 d'obtenir une proteine chimere Ps-DP-TMEl. II peut 
s'agir par exemple, avantageusement, des sequences 
IDn°37 / IDn°38 et IDn°39 de la liste de sequences 
annexee pour TME2 , permettant d' obtenir une proteine 
chimere Ps-DP-TME2. 
10 En effet, les sequences nucleotidiques 

precit6es presentent des codons optimises pour 
1' expression de TME1 et TME2 dans une bacterie, par 
exemple chez E. coll. 

II existe un grand nombre de sequences de l'ARN du 
15 VHC produisant un ph£notype infectieux : ces sequences sont 
6galement utilisables dans la pr£sente invention. 

La sequence codant pour le dipeptide Asp-Pro peut 
§tre par exemple : gacccg, ou toute autre sequence codant 
pour ce dipeptide. 
20 La sequence codant pour la GST peut etre par 

exemple celle pr6sente dans les plasmides pGEXKT dont la 
sequence correspond & la sequence IDn°29 de la liste de 
sequence annexee ou toute sequence 6quivalente, c'est £ dire 
codant pour cette proteine soluble. La sequence codant pour 
25 la TrX peut §tre par exemple celle pr<§sente dans le plasmide 
d' expression pET32a+ dont la sequence correspond £ la 
sequence IDn°30 de la liste de sequence annexee ou toute 
sequence 6quivalente, c'est A dire codant pour cette 
proteine soluble. 
30 Pour la fabrication de la proteine toxique, le 

systeme d' expression dp-pt ou ps-dp-pt de 1' invention 
est place k l'interieur d'une cellule hote par exemple 
par clonage dans un plasmide approprie et ceci par les 
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techniques habituelles de transformation d'un hote dans 
les techniques de recombinaison genetique . 

Le plasmide dans lequel le systeme d' expression 
de la presente invention peut etre clone pour former ce 
5 vecteur sera choisi notamment en fonction de la cellule 
hote, II peut s'agir par exemple du plasmide pT7-7 
(sequence IDn°33 de la liste de sequences annexee) , 
d'un plasmide de la s6rie pGEX (par exemple de sequence 
IDn°31 de la liste de sequences annexee) , commercialism 

10 par exemple par la societe Pharmacia , ou un plasmide de 
la s6rie pET32 (par exemple de* sequence IDn°32 de la 
liste de sequences annexee) , commercialise par exemple 
par la societe Novagen. 

Les plasmides de la serie pGEX et de la serie 

15 pET32 seront avantageusement utilises pour la ' raise en 
oeuvre de la presente invention. En effet, ils 
comprennent d6ja une sequence ps codant pour une 
proteine soluble (Ps) , respectivement pour la 
glutathion S-transf §rase et pour la thior^doxine . 

20 Aussi, avantageusement, le systeme dp-pt sera clone 
dans ces plasmides en aval de cette sequence ps codant 
pour la proteine soluble. 

La presente invention se rapporte done 
egalement & un vecteur d' expression comprenant un 

25 systeme d' expression selon 1' invention dp-pt ou 
ps-dp-pt ; en particulier un vecteur comprenant un 
systeme d' expression dp-pt selon 1' invention et la 
sequence oligonucleotidique du plasmide pT7-7, ou un 
vecteur comprenant un systeme d f expression ps-dp-pt 

30 selon 1' invention et la sequence oligonucleotidique 
. d'un plasmide pGEX ou d'un plasmide pET32. 
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Par exemple, les vecteurs d' expression de la 
presente invention, convenant a un hote bacterien tel 
que E. coll, et permettant la surexpression de la 
prot6ine membranaire TME1 precitee, peuvent avoir 
5 avantageusement une sequence oligonucl6otidique choisie 
parmi les sequences IDn°40 (avec pGEXKT), IDn°42 (avec 
pET32a+) et IDn°44 (avec pT7-7) de la liste de 
sequences annex6e . 

Par exemple, les vecteurs d' expression de la 

10 presente invention, convenant A un hote bacterien tel 
que E. colir et permettant la subexpression de la 
prot6ine membranaire TME2 precit£e, peuvent avoir 
avantageusement une sequence oligonucleotidique choisie 
parmi les sequences IDn°41 (avec pGEXKT) , IDn°43 (avec 

15 pET32a+) et IDn°45 (avec pT7-7) de la liste de 
sequences annex6e. 

En effet, les vecteurs d' expression precites 
presentent des codons optimises pour 1' expression des 
proteines chimferes de la presente invention, incluant 

20 TME1 et TME2, dans une bacterie, par exemple chez E. 
coll. 

La presente invention se rapporte 6galement a 
une cellule procaryote trans form6e par un vecteur 
d' expression selon 1' invention. Cette cellule 

25 procaryote transformee par le vecteur d' expression de 
la presente invention doit de preference permettre la 
surexpression de la proteine toxique pour laquelle code 
le vecteur. Ainsi, toute cellule hote capable de 
d'exprimer le vecteur d' expression de la presente 

30 invention est. utilisable, par exemple E.coll, 
avantageusement, la souche E. coll BL21 (DE3) pLysS . 



WO 2004/027068 




T/FR2003/002763 



12 

La presente invention se rapporte egalement a 
un procede de fabrication d'une proteine toxique par 
recombinaison genetique comprenant . les etapes 
suivantes : 

5 - transformer une cellule hote avec un 

vecteur d' expression selon l f invention, 

cultiver la cellule hote transformee dans 
des conditions de culture telles qu'elle fabrique une 
prot6ine de fusion comprenant le dipeptide Asp-Pro 
10 suivi de la sequence peptidique de la proteine toxique 
a partir dudit vecteur d' expression, et 

isoler ladite proteine de fusion, et 
cliver ladite proteine de fusion pour 
recuperer la proteine toxique. 
15 Les etapes de transformation, de culture, ainsi 

que de l'isolement de la proteine chimere fabriquee 
peuvent etre realisees par les techniques habituelles 
de recombinaison g6n§tique, par exemple par des 
techniques telles que celles qui sont decrites dans le 
20 document [25] • 

L'6tape consistant & isoler la proteine de 
fusion peut etre realisee par les techniques 
habituelles connues de l'homme du metier pour isoler 
une proteine d'un extrait cellulaire. 
25 La proteine de fusion fabriquee par le proc6de 

de 1' invention a une sequence « Proteine soluble-Asp- 
Pro-proteine toxique ». Dans la presente description, 
le dipeptide Asp-Pro est aussi appel6 DP suivant le 
code £ une lettre des acides amines. 
30 Par exemple, lorsque la proteine toxique est 

TMEl, la proteine de fusion peut avoir la sequence 



/ 
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IDn°4 6 de la liste de sequences annexee, qui correspond 
a la proteine de fusion GST-DP-TME1 ; la sequence 
IDn°4 8 de la liste de sequences annexee, qui correspond 
a la proteine de fusion TrX-DP-TMEl ; ou la sequence 
5 IDn°50 de la liste de sequences annexee, qui correspond 
a la proteine de fusion M-DP-TME1 de la liste de 
sequences annexee . 



TME2 , la proteine de fusion peut avoir la sequence 
10 IDn°47 de la liste de sequences annexee, qui correspond 



£ la proteine de fusion TrX-DP-TME2 ; ou la sequence 
IDn°51 de la liste de sequences annexee, qui correspond 



peut etre realisee avantageusement au moyen d' acide 
formique qui clive la proteine de fusion au niveau du 
20 dipeptide Asp-Pro. Elle peut etre r§alisee par ailleurs 
par toute technique appropriee connue de l'homme du 
metier pour recuperer une proteine d'un §chantillon a 
partir d'une proteine de fusion. 

25 Les inventeurs sont les premiers a avoir trouve 

un systeme reellement efficace pour produire et merae de 
surproduire, notamment dans la bact§rie Escherichia 
coli ( E. coli) des peptides hydrophobes correspondant 
aux domaines membranaires des proteines El et E2 de 

30 1'enveloppe du virus de 1' hepatite C, dont 1' expression 
est 16tale pour le. microorganisme . 



Par exemple, lorsque la proteine toxique est 



A la proteine de fusion GST-DP-TME2 ; la sequence 
IDn°4 9 de la liste de sequences annexee, qui correspond 



15 



A la proteine de fusion M-DP-TME2 de la liste de 
sequences annexee. 

L'6tape de clivage de cette proteine de fusion 
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Le champ d' applications de la presente 
invention concerne principalement la production de 
peptides hydrophobes a grande echelle notamment pour la 
recherche f ondamentale et industrielle . En outre, la 
5 production de la proteine chimere constitute de la 
proteine soluble, du dipeptide Asp-Pro, et du peptide 
hydrophobe peut etre utilisee dans un but fonctionnel, 
notamment pour renseigner sur le degre 

d' oligomerisation du domaine membranaire ou encore sur 

10 sa capacite d' heteropolymtrisation. 

Les proteines de fusion, ou proteines chimdr.es, 
sont produites via leur ADN codant present par exemple 
dans des plasmides commerciaux et & la suite desquels 
est introduit en phase 1' ADN codant pour la sequence 

15 Asp-Pro suivi de celui codant pour le peptide toxique. 
Cette application peut §tre commercialism sous la 
forme de plasmides d' expression bact6riens qui 
incluront la sequence du site Asp-Pro, en aval de celle 
des prot6ines solubles dej& presentes. Le plasmide 

20 correspondant sera d6crit par exemple comme un outil 
facilitant la production par voie biologique de 
peptides ou proteines membranaires toxiques . 

Ainsi, la presente invention est applicable £ 
tout systeme de surexpression de proteines 

25 recombinantes, avec ou sans fusion a une proteine 
soluble comme par exemple la GST, ou la thioredoxine, 
incluant une sequence Asp-Pro non naturelle inseree en 
amont d' une sequence codant pour un domaine toxique de 
la proteine, par exemple un domaine membranaire d'une 

30 proteine. 



WO 2004/027068 




T/FR2003/002763 



15 

D'autres caracteristiques et avantages de la 
presente invention apparaitront encore a l'homme du 
metier a la lecture des exemples suivants donnes a 
titre illustratif et non limitatif en reference . a la 
5 liste de sequences et aux figures annexees. 

Breve description de la liste de sequences annexee 

Sequences IDn°l et 2 :* respectivement, sequences 
peptidiques de TME1 et de TME2 . 

10 - : Sequences IDn°3 et 4 : respectivement, sequences 
codant pour le peptide TME1 et le peptide TME2 . 
Sequences IDn°5 et 6 : respectivement, 
oligonucleotide (+) d' insertion dans pT7-7 
<OL13(+)) et oligonucleotide (-) d' insertion dans 

15 pT7-7 (OL14(-)). 

Sequences IDn°7 et 8 : respectivement , ADN sens 
codant de TME1 + site cla I en 3' et ADN sens 
anticodant de TME1 + site cla I en 5' (sequence 
compiementaire de la sequence IDn°7) . 

20 - Sequences IDn°9 et 10 : respectivement, 
oligonucleotide sens codant (0L11(+)) et 
oligonucleotide sens anticodant (OL12(-)) pour la 
synthese de TME1. 

Sequence IDn°ll : oligonucleotide (+) 
25 d' insertion dans pGEXKT sans site dp (OLl5(+)). 

Sequence IDn°12 : oligonucleotide {+) 

d' insertion dans pGEXKT avec site dp (OL17 (+) ) . 

sequence IDn°13 : oligonucleotide (-) 

d' insertion dans pGEXKT (OL16(-)). 
30 - sequence IDn 6 14 : oligonucleotide (+) 

d' insertion dans pET32a (OL18 (+) ) (s' hybride au 

segment 915-932 de pGEXKT) . 
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Sequences IDn°15 et 16 : respectivement, 
oligonucleotides (+) (OL19(+)) et (-) (OL20(-)) 
d' insertion dans pT7-7 de l'ADN codant pour MDP- 
TME1 . 

5 - Sequences IDn°17 et 18 : respectivement, 
oligonucleotide ( + ) d' insertion dans pT7-7 
(OL23(+)) et oligonucleotide (-) d' insertion dans 
pT7-7 <OL24(-)) . 

Sequences IDn°19 et 20 : respectivement, ADN sens 
10 codant pour TME2 -h> site de Nde I en 5' et Hind III 

en 3' ; et ADN sens anticodant de TME2 +. site Nde I 
en 3' et Hind III en 5' (sequence compl6mentaire de 
IDn°17). 

Sequences IDn°21 et 22 : respectivement , 
15 oligonucleotides sens codant (OL21(+)) et 

anticodant (OL22(-)) pour la synthase de TME2 . 
Sequence IDn° 23 : oligonucleotide ( + ) 

d' insertion dans pGEXKT sans site dp (OL25(+)). 
Sequences IDn°24 et 25 : respectivement, 
20 oligonucleotides (+) (OL27(+)) et (-) (OL26(-)) 

d' insertion dans pGEXKT avec site dp. 
Sequences IDn°2 6 et 27 : respectivement, 
oligonucleotides ( + ) (OL28(+)) et (-) (OL29(-)) 
d' insertion dans pT7-7 de l'ADN codant pour MDP- 
25 TME2 . 

Sequence IDn°28 : fin de la sequence de la 
prot£irie soluble GST suivie du site thrombine codee 
dans le.plasmide pGEXKT. 

Sequence IDn°29 : ADN codant pour la proteine 
30 GST dans le plasmide pGEXKT. 
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Sequence IDn°30 : ADN codant pour la 

thioredoxine (TrX) dans le plasmide pET32a+. 
Sequences IDn°31, 32 et 33 : respectivement, 
plasmides d' expression pGEXKT , pET32a+ et pT7-7. 
5 - Sequences IDn°34, 35 et 36 : respectivement, 
systemes d' expression selon 1' invention codant pour 
les proteines de fusion GST-DP-TME1, TrX-DP-TMEl et 
M-DP-TME1. * 

Sequences IDn°37, 38 et 39 : respectivement, 
10 systfemes d' expression selon 1' invention codant pour 

les proteines. de 'fusion GST-DP-TME2 , T r X - DP - TME 2 et 
M-DP-TME2.. 

Sequences IDn°40 et 41 : respectivement, vecteurs 
d' expression pGEXKT-dp-pt TME i et pGEXKT-c(p-ptTME2 
15 selon 1' invention codant pour les proteines de 

fusion GST-DP-TME1 et GST-DP-TME2 . 

Sequences IDn°42 et 43 : respectivement, vecteurs 
d' expression pET 32 a- dp ~pt T MEi et pET3 2 a -dp -ptxME2 
selon 1' invention codant pour les proteines de 
20 fusion TrX-DP-TMEl et T rX - DP -TME 2 (codent par le 

brin complementaire) . 

Sequences IDn°44 et 45 : respectivement, vecteurs 
d' expression pT7-7-dp-pt T MEi et pT7-7-dp-pt TME 2 selon 
1' invention codant pour les proteines de fusion M- 

25 DP-TME1 et M-DP-TME2 . 

Sequences. IDn°46 et 47 : respectivement, proteines 
de fusion GST-DP-TME1 et GST-DP-TME2 selon 
1' invention obtenues a partir des plasmides pGEXKT- 
dp-p Ctmei et pGEXKT - dp -p tTME2 . 

30 - Sequences IDn°48 et 49 : respectivement, proteines 
de fusion TrX-DP-TMEl et TrX-DP-TME2 selon 
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1' invention obtenues a partir des plasmides pET32a- 
dp-pt-mEi et pET 3 2a- dp -pt TM E2 • 

Sequences IDn°50 et 51 : respectivement, proteines 
de fusion M-DP-TME1 et M-DP-TME2 selon 1' invention 
5 obtenues a partir des plasmides pT7-7-dp-ptxMEi et 

pT7-7-dp-ptTME2. 

Sequences IDn°52 et 53 : respectivement, proteines 
GST et TrX codees par le vecteur pGEXKT et pET32a+. 

10 Breve description des figures 

Figure 1 : representation schematique d'une ^>artie 
de la polypropteine du VHC et sequence peptidique des 
domaines membranaires C-terminaux des proteines 
d'enveloppe El et E2 . Les sequences peptidiques 

15 representees correspondent au type infectieux #D00831 
et #M67 4 63 pour TME1 et TME2 respectivement obtenus de 
la banque publique de sequences Du Laboratoire Europ§en de 
Biologie Mol6culaire (« European Molecular Biology 
Laboratory ») (EMBL) . 

20 - Figure 2 : creation de l'ADN codant pour le domaine 
membranaire C-terminal de la proteine d'enveloppe El du 
VHC et sequences additionnelles en 5' et 3' pour 
clonage dans differents plasmides. Les sequences 
representees sur cette figure sont reportees dans la 

25 liste de sequences annex6e. 

Figure 3 : creation de l'ADN codant pour le domaine 
membranaire C-terminal de la proteine d'enveloppe E2 du 
VHC et sequences additionnelles en 5' et 3' pour 
clonage dans differents plasmides. Les sequences 

30 representees sur cette figure sont reportees dans la 
liste de sequences annexee. 
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Figure 4, panneaux A a F : toxicite des domaines 
membranaires exprimes dans la bacterie et suppression 
de cette toxicite par insertion d'un site dp. Les 
panneaux A, C et E sont des representations graphiques 
5 de mesures de la densite optique (DO) a 600 nra en 
fonction du temps (t) en heures de la production de 
differentes proteines dans une bacterie utilisant ou 
non le systeme d' expression de la presente invention. 
Les panneaux B, D et F sont des representations des 

10 gels de migration des proteines respectivement des 
panneaux A, C et E. 

Figures 5 A et B : surexpression des proteines. 
chimeres thioredoxine-Asp-Pro-Pt (Pt = domaines 
membranaires des proteines) dans la bacterie. La figure 

15 5A est une representation graphique de mesures de la 
densite optique (DO) a 600 nm en fonction du temps en 
heures de la production de differentes proteines dans 
une bacterie utilisant ou non le systeme d' expression 
de la presente invention. La figure 5B est une 

20 representation d'un gel de migration des proteines de 
la figure 5A. 

Figure 6 : expression et purification de la 
proteine de fusion (ou chimdre) GST-TME2, et 
comparaison avec la GST seule. Cette figure represente 

25 en haut les sequences peptidiques de GST et GST-TME2, 
et en bas les gels obtenus par §lectrophor£se montrant 
que contrairement a GST seule, GST-TME2 est insoluble. 
Cette dernidre est produite sous forme de corps 
d' inclusion qui ne peuvent pas se replier correctement . 

30 - Figures 7A et 7B : representations graphiques de 
resultats experimentaux comparatifs montrant l'effet du 
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dipeptide DP (sequence oligonucleotidique dp-pt 
conforme & la presente invention) et du dipeptide DP et 
de la proteine soluble (sequence oligonucleotidique ps- 
dp-pt conforme ci la . presente invention) sur la synthese 
5 des proteines toxiques TME1 et de TME2 conf ormement a 
la presente invention. 

EXEMPLES 

10 ' Dans pes exemple, les oligonucleotides utilises 

ont 6t6 commandes aux Laboratoires EURQBIO 
(http://www.eurobio.fr/); . les plasmides ont et6 
prepares avec le kit QlAprep (marque de commerce) de 
QIAGEN (http://www.qiagen.com/); les sequences d'ADN 

15 ont ete sequencees avec le kit ABI PRISM (marque 
deposee) BigDye (marque de commerce) Terminator cycle 
d' Applied Biosys terns 

(http://home.appliedbiosystems.com/) ; les souches d'E. 
coli BL2KDE3) et BL21 (DE3) pLysS ont ete obtenues chez 

20 Stratagene (http://www.stratagene.com/); les souches 
C41 et C43 (BL21 ( DE3) ) ont ete fournies par le Dr. 
Bruno Miroux (CNRS-CEREMOD, Centre de recherches sur 
1 'endocrinologie moleculaire et le developpement ; les 
enzymes de restriction et modification d'ADN ont ete 

25 obtenues chez New England ' Biolabs 

(http://www.neb.com/neb/); les Electrophoreses de 
proteines ont et6 r6alisees avec un miniprotean 3 
(marque de commerce) des Laboratoires Bio-Rad 
(http://www.bio-rad.com); le plasmide pCR (marque 

30 deposEe) T7 topo TA a 6te obtenu chez Invitrogen 
(http://www.invitrogen.com/); le plasmide pET32a+ a ete 
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obtenu chez Novagen (http://www.novagen.com); les 
plasmides pT7-7 et pGPl-2 et la souche K38 [22] ont ete 
demandes au Prof. Tabor (Department of Biological 
Chemistry , Harvard Medical School) ; le plasmide 
5 pGEX-KT a ete demande au Prof. Dixon (Department of 
Biological Chemistry, University of Michigan Medical 
School) ; les autres produits ont ete obtenus chez 
Sigma (http://sigma.aldrich.com) . 

Dans les exemples suivants, la production des 

10 peptides TME1 et TME2 a ete dans un premier temps 
realisee sans le systfeme d' expression de la presente 
invention, puis en fusion avec une proteine soluble, et 
enfin en fusion avec la GST avec insertion du site Asp- 
Pro (« DP » en codage a une lettre) entre la proteine 

15 soluble et TME1 ou TME2 . 

L' abreviation « SEQ . IDn° » est utilisee pour 
« sequence IDn° » et renvoie a la liste de sequences 
annexee . 

20 Exenple 1 : Synthese du systeme d/ expression 

1-1) CONSTRUCTION DES VECTEURS D' EXPRESSION pT7-7-pt TME i 
ET pT7-7-pt T ME2 

L'ADN codant pour les deux domaines a ete 
synthetise de novo a partir des oligonucleotides 

25 appropries. Les codons ont ete choisis suivant leur 
plus grande frequence d' utilisation dans la bacterie, 
telle qu'elle a 6t6 quantifi£e par Sharp et col. [17]. 
Les constructions sont decrites sur la figure 2 annexee 
pour TME1 et sur la figure 3 annexee pour TME2 . 

30 Chaque ADN synthetique a ete gendre en 

utilisant un jeu de deux oligonucleotides longs et 
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chevauchants, OLll (SEQ IDn°9) et OL12 (SEQ n°10) pour 
TME1 et OL2KSEQ IDn°19) et OL22 (SEQ IDn°20) pour 
TME2 / qui ont §te amplifies apres hybridation avec deux 
oligonucleotides externes choisis en fonction du 
5 clonage dans un plasmide donne . Ainsi les clonages dans 
pT7-7 ont ete realises en utilisant le jeu 
d' oligonucleotides externes OL13 (SEQ IDn°5) et OL14 
(SEQ IDn°6) pour TME1 et OL23 (SEQ IDn°15) et OL24 (SEQ 
IDn°16) pour TME2 . 

10 Chaque ADN synthetique ' a ete genef6 en 

utilisant un jeu de quatre oligonucleotides : deux 
longs et chevauchants et deux courts et externes. Les 
ADN ont ete amplifies par la methode de reaction de 
polymerisation en chaine (« polymerase chain 

15 reaction ») dite de "PCR" [18] puis clones dans un 
plasmide bacterien pCR (marque de commerce) T7 topo TA. 
Les ADN synth6tises ont ete sequences puis sous -clones 
dans le vecteur d' expression bacterien pT7-7 [19] en 
utilisant les sites de restriction Nde I en 5' et Cla I 

20 ou Hind III en 3' . 

Sur la figure 2 : 

A : Sequence peptidique TME1 du sous-type #D00831. La 
numerotation correspond a la position de la sequence 
25 dans la polyproteine comme decrit sur la figure 1. 

B : Sequence d' ADN codant pour le domaine membranaire 
avec des. codons optimises pour 1' expression dans la 
bacterie . 

C et D : Strat^gie d 1 amplification sans matrice de 
30 I'ADN. Le sens codant et le sens anticodant des 
oligonucleotides sont indiqu^s respectivement par les 
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signes ( + ) et (-) . Les oligonucleotides longs sont 
chevauchants d'une vingtaine de bases pour creer 
1' amorce puis la matrice. Les oligonucleotides courts 
permettent d 1 amplifier la matrice par PCR en integrant 
5 les sites de restriction desires et suivant les 
plasmides utilises. L' insertion dans pT7-7 a 6te 
realisee avec le couple d 1 oligonucleotides OL13 (SEQ 
IDn°5) et OL14 (SEQ IDn°6), via un sous-clonage dans 
pCRT7 topo, en integrant les sites Nde I et Hind III. 

10 L 1 insertion dans pGEXKT a ete ef£<ectuee suivant la meme 
methode . avec le couple d 1 oligonucleotides OL15 (SEQ 
IDn°ll) et 0L16 (SEQ IDn°13) en integrant les sites 
BamH I et EcoR I. L 1 insertion du site dp (gacccg) et le 
clonage dans pGEXKT ont ete ef f ectues avec le couple 

15 d' oligonucleotides OL17 (SEQ IDn°12) et OL16 (SEQ 
IDn°13) • La construction dans pGEXKT a ete transferee 
dans pET32a qui code pour la thioredoxine avec le 
couple d 1 oligonucleotides 0L18 (SEQ IDn°14) et 0L16 
(SEQ IDn°13), L' oligonucleotide OL18 (SEQ IDn°14) 

20 s'hybride dans la region terminale de l'ADN codant pour 
la GST dans pGEXKT. La sequence amplifiee int^gre la 
fin de la GST (SDLSGGGGG) suivie du site thrombine 
(LVPRGS) (SEQ IDn^S), du site DP et du passage 
membranaire . Apres clonage, l'ADN insere dans pET32a 

25 permet d'exprimer la chim^re thioredoxine- 
SDLSGGGGGLVPRGS-DP-TME1 (SEQ IDn°48). 

Sur la figure 3 : 

La l^gende est identique a la figure 2, mais La 
30 sequence peptidique est celle du sous-type #M67463. 
L* insertion dans pT7-7 a et6 realisee avec le couple 
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d* oligonucleotides OL23 et OL24 ( respect ivement SEQ 
IDn°17 et SEQ IDn°18) via un sous-clonage dans pCRT7 
topo en integrant les sites Nde I et Hind III. 

L 1 insertion dans pGEXKT a ete effectuee suivant 
5 la meme methode avec le couple d 1 oligonucleotides OL25 
et OL26 (respect ivement SEQ IDn°23 et SEQ IDn°25) 
integrant les sites BairiH I et EcoR I. L' insertion du 
site dp (gacccg) et le clonage dans pGEXKT ont ete 
effectues avec le couple d 1 oligonucleotides OL27 et 
10 OL26 . (respectivement .SEQ. IDn°24 et SEQ IDn°25) • 
L' insertion dans pET32a a et§ effectuee comme decrit 
sur la figure 2 en utilisant le couple 
d' oligonucleotides OL18 et OL26 (respectivement SEQ 
IDn°14 et SEQ IDn°25) . 

15 

1.2) CONSTRUCTION DES VECTEURS D' EXPRESSION 

pGEXKT -ptTMEif pGEXKT-pt TM £2/ pGEXKT - dp-p t tmei ET 

pGEXKT — dp-p £tme2 

Les vecteurs d' expression pGEXKT ~p t tmei et 

20 pGEXKT -p txME2 ont 6t6 construits par PCR comme d§crits 
sur les figures 2 et 3 annexees. L' ADN-matrice utilise 
pour amplifier les ADN codant pour TMEI ou TME2 est 
celui clon6 dans les plasmides pT7-7. Le clonage dans 
le plasmide pGEXKT [20, 21] de TMEI a <§ste realise en 

25 utilisant les jeux d' oligonucleotides OL15 (SEQ IDn°ll) 
et. OL16 (SEQ IDn°13) permettant 1' insertion des sites 
de restriction BamH I en 5' et EcoR I en 3' . Le clonage 
de TME2 dans le meme vecteur a ete realise en utilisant 
les jeux d' oligonucleotides OL25 (SEQ IDn°21) et OL26 

30 (SEQ IDn°23) . 



WO 2004/027068 




T/FR2003/002763 



25 

Comme indique dans la figure 2, 1' insertion du 
site dp en position N-terminale de TME1 a 6te realisee 
en remplagant 1' oligonucleotide 5 f OL15 (SEQ IDn°ll) 
par 1' oligonucleotide OL17 (SEQ IDn°12) . L' insertion du 
5 site dp en position N-terminale de TME2 a ete realisee 
en remplagant 1' oligonucleotide 5' OL25 (SEQ IDn°21) 
par 1' oligonucleotide OL27 (SEQ IDn°22) , comme montre 
dans la figure 3. 

10 1.3) CONSTRUCTION PES , VECTEURS D f EXPRESSION 

p'ET32a-dp-TMEl ET pET32a-dp-TME2 

Les vecteurs d' expression pET32a-dp-TMEl et 
pET32a-dp-TME2 ont ete construits par PCR comme decrits 
sur les figures 2 et 3 annexees, en utilisant le jeu 

15 d' oligonucleotides indique. 1/ oligonucleotide amont 
integre un site EcoR V et s'hybride avec la region 
terminale de gfene codant pour la GST. II permet 
d'integrer la queue de 5 glycines et le site de clivage 
par la thrombine presents dans le plasmide. 

20 L' oligonucleotide en aval est le meme que celui utilise 
pour le clonage dans pGEXKT. 

L' insertion dans le plasmide pET32a se fait par 
les sites MsC I/EcoR V en 5 f et EcoR I en 3' . II permet 
d' inserer en phase a la fin de la sequence de la 

25 thioredoxine la queue de 5 glycines, le site de clivage 
par la thrombine, le site DP et le passage membranaire. 
Le plasmide d' origine pET32a, qui sert de temoin, code 
pour la thioredoxine suivie d'une sequence integrant 
divers 616ments qui n'ont pas 6te supprimes et qui 

30 contribuent pour une bonne part a la masse de la 
proteine chim^re f abriqu6e . 
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L' ADN-matrice utilise pour amplifier les ADN 
codant pour TME1 ou TME2 est celui clone dans les 
plasmides pGEXKT-dp-ptxMEi ou pGEXKT - dp -pt TM E2 . Pour TME1, 
le clonage dans pET32a+ a ete realise en utilisant les 
jeux d' oligonucleotides OL18 (SEQ IDn°14) et OL16 
(SEQ IDn°13) . Le clonage de TME2 dans le meme vecteur a 
et6 realist en utilisant les jeux d' oligonucleotides 
OL18 (SEQ IDn°14) et OL26 (SEQ IDn°23) , comme indique 
dans la figure 3. 



Exemple 2 : Expression de sequences codant .pour les 
proteines TMEl et TME2 seules 

L' expression des sequences codant pour les 
domaines seuls TME1 et TME2 a ete testee par induction 
15 thermique ou chimique et en utilisant diff^rentes 
souches bacteriennes comme decrit ci-apres. 

2.1) SYSTEME D' INDUCTION THERMIQUE 

Le systeme d6velopp6 par Tabor [22] permet 
20 d'exprimer une proteine par induction thermique en 
utilisant deux vecteurs dans une meme bacterie, pT7-7 
et pGPl-2. 

Le plasmide pT7-7 contient 1' ADN a exprimer, 
plac6 sous controle d' un promoteur <j)10 reconnu par 

25 l'ARN polymerase du phage T7 . Le plasmide pGPl-2 
contient le gene codant pour la polymerase du phage T7, 
plac6 sous le controle d'un promoteur Ap L . Ce promoteur 
est reprime par un represseur thermosensible, cI857, 
present lui aussi dans pGPl-2. A 30°C, cI857 est 

30 normalement exprim6 et r6prime le promoteur \pi, ce qui 
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bloque 1' expression de la polymerase et done aussi 

celle de la proteine d'interet. 

L' induction est declenchee par un passage de la 

culture de 37 £ 42°C pendant 15-30 min, puis 
5 1' expression se poursuit a 37 °C. Ce systeme est done 

particulierement bien adapte lorsqu' il est necessaire 

de controler strictemerit l f expression d'une proteine 

donnee, notamment si celle-ci est toxique pour la 

bacterie . 
10 _ - 

2.2) SYSTEME D' INDUCTION CHIMIQUE 

Le meme plasmide pT7-7 contenant l'ADN a 

exprimer est cette fois introduit dans des bacteries E. 

coli de type . BL21 (DE3) (B F" dem omtP hsdS(r^m^) gal A. 

15 (DE3) et BL21 (DE3)pLysS (B F" dem ompT hsdS(r~m~) gal X 

(DE3) [pLysS Cam r ]) . Ces bacteries ont et6 modifiees 
pour contenir dans le genome une copie du gene codant 
pour l'ARN polymerase du phage T7, plac6 sous controle 
d'un promoteur lacUV5 inductible par 1' isopropyle-1- 

20 thio-p-D-galactoside (IPTG) . Dans ce cas, les bacteries 
sont cultiv^es A leur temperature optimum de 37 °C ou 
moins si necessaire. 1/ expression est induite par 
addition d' IPTG dans la culture. La souche 
BL21 (DE3) pLysS est particulierement bien adaptee aux 

25 proteines dont 1' expression basale est toxique pour la 
bact§rie hote . En effet, la presence du plasmide pLysS 
permet 1' expression continue et a un faible niveau de 
lysozyme du phage T7 . Celui-ci inhibe la polymerase du 
phage T7, dont la faible expression en absence 

30 d' induction pourrait permettre 1' expression basale de 
proteine toxique. 
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Les inventeurs ont aussi teste 1' expression des 
domaines membranaires seuls dans des souches appelees 
C41 et C43 [10] qui ont ete selectionnSes pour resister 
a 1' expression de proteines membranaires toxiques. Ces 
5 souches sont derivees de la souche BL21(DE3) et sont 
utilisees de la meme fagon que cette derniere. 

2.3) TESTS D' EXPRESSION 

Suivant le systeme test6, les plasmides 
10 correspondents ont 6te introduits par transformation 
dans les diff§rentes souches d'E. coli : K38 (HfrC X) 
pour le systeme d' induction thermique de Tabor ou les 
differentes souches BL21 pour 1' induction chimique . Le 
tableau 1 suivant resume les tests effectu6s. 

15 

Tableau 1 



Induction 


Souche 


Plasmide 


Thermique 


K38 


pT7-7 + pGP1-2 


Chimique 


BL21(DE3) 


pT7-7 


Chimique 


BL21(DE3)pLysS 


pT7-7 


Chimique 


C41 (BL21(DE3)) 


pT7-7 


Chimique 


C43 (BL21(DE3)) 


pT7-7 



Dans chaque cas, une dizaine de transf ormants 
20 ont ete mis en culture pour tester 1' expression . 
Brievement, les bacteries ont ete mises en culture dans 
5 ml de LB (10 g tryptone, 5 g extrait de levure, 5 g 
NaCl, qsp . 1 litre H 2 0) complements avec 50 pg/ml 
d' ampicilline (necessaire pour maintenir pT7-7 dans la 
25 bacterie) et 60 pg/ml de kanamycine (n6cessaire pour 
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maintenir pGPl-2 dans la. bacterie) puis cultivees 
jusqu'a saturation soit a 30°C pour K38, soit a 37°C 
pour BL21(DE3). Les cultures sont ensuite diluees au 
1/10 dans le meme milieu de culture et cultivees 
5 jusqu'a une densite optique* (DO) de 1 mesuree a 600 nm 
sur un spectrophotometre Philips PU8740 (marque de 
commerce) . 

L' expression est ensuite induite soit 
thermiquement (K38) a 42°C pendant 15 min, soit 

10 chimiquement (BL21 (DE3) ) par addition de 1 mM d'IPTG. 
Elle est poursuivie pendant 3-5 heures a 37 °C. La DOeoonm 
des cultures est mesuree a differents temps. 

A la fin de 1' expression, un volume de culture 
contenant 1' equivalent de 0,1 DO de bacteries est 

15 preleve. Les bacteries sont recoltees par 
centrifugation et suspendues dans 50 ]il de solution de 
lyse (SL : Tris-Cl 50 mM, pH 8,0, EDTA 2,5 mM, SDS 2%, 
ur£e 4 M, P-mercaptoethanol 0,7 M) . Apres quelques 
minutes a temperature ambiante, 10 ]il sont deposes sur 

20 gel de polyacrylamide 16,5% pour electrophor^se de type 
"Tricine" [23] qui permet de bien separer les proteines 
de petite masse mol6culaire. 

Sur la figure 4 : 

25 Panneaux A, C et E : Les bacteries ont ete transformees 
avec les plasmides pT7-7, pT7-7-TMEl, pT7-7-TME2 
(panneau A), pGEXKT , pGEXKT -TME 1 , pGEXKT-TME2 (panneau 
C) et pGEXKT-dp-TMEl, pGEXKT-dp-TME2 (panneau E) puis 
mises en culture et induites comme d6crit ci-dessus. La 

30 croissance bact6rienne a ete suivie en mesurant 
1 1 augmentation de turbidite de chaque culture par 
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mesure de la densite optique a 600 run en fonction du 
temps en heures. 

Panneaux B, D, F : Les bacteries ont 6te pr61ev§es au 
temps indique dans le texte et traitees comme decrit 
5 ci-dessus. Elles ont ensuite et6 deposees sur gel 
d' 61ectrophorese, soit 16,5% d' acrylamide de type 
"Tricine" (panneau B) , soit 14% d' acrylamide de type 
Laemmli SDS-PAGE (panneaux D et F) . L ' electrophorese 
montr6e' dans le panneau F a migr6 plus longtemps que 
10 celle montree dans le panneau D, ceci pour ameliorer la 
separation des bandes dans la zone des .30000 Da. Apr6s 
migration/ les gels ont ete color^s 10 minutes par du 
bleu de Coomassie dans une solution de 40% methanol, 
10% d'acide acetique, 0,1% bleu de Coomassie R250, puis 
15 decolores dans une solution 10% methanol , 10% acide 
acetique, 1% glycerol. 

Quelque soit le systeme teste, la premiere 
observation est que la frequence de transformation des 
bacteries a ete faible. Pour les bactferies qui ont pu 
etre selectionn§es, le resultat des tests d' expression 
a £te systematiquement negatif. Un exemple est donne 
sur la figure 4, panneaux A et B, avec les series 
BL21 (DE3)pLysS {[pT7-7], [pT7-7-TMEl] ou [pT7-7-TME2]} . 
Comme l'illustre la comparaison des courbes de 
croissance du panneaux A de la figure 4, les inventeurs 
ont constat^ avec les clones transformes avec 
pT7-7-TMEl ou pT7-7-TME2 et resistants sur milieu 
solide, que 1' induction stoppe quasi-immediatement la 
croissance bacterienne, contrairement aux clones 
contenant le plasmide seul. De meme, comme c'est 



20 
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visible sur la figure 4(B), aucune bande de proteines 
migrant dans la region correspondant a la masse 
moleculaire des produits d' expression (- 3-4000 Da) ou 
d'oligomeres de ceux-ci ({1, 2, 3, ...}) x masse 
5 moleculaire) n' est en effet observable. 

L' explication la plus probable a cette 
situation est que 1' expression des domaines 
membranaires est tres toxique pour la bacterie. La 
difficult^ d'obtenir des transf ormants laisse supposer 

10 qu' une expression basale, meme tres faible, suffit a 
les tuer. Ceci montre aussi que le syst£me pLysS n'est 
pas parfait pour prevenir cette expression basale. 
Parmi les bacteries qui resistent a 1'etape de 
transformation, 1' induction de l f expression des 

15 domaines hydrophobes devient immediatement letale. Les 
systemes utilises permettent ef f ectivement de proteger 
la bacterie hote d'une expression basale, mais d£s que 
celle-ci est induite, la toxicite est immediate et les 
bacteries sont tuees. 

20 

Exemple 3 ; Expression de sequences codant pour les 
proteines de fusion GST-TME1 et GST-TME2 

Les vecteurs d' expression ont ete construits 
comme decrit dans 1' exemple 1, puis introduits dans les 
25 bacteries BL21 (DE3) pLysS . Les bacteries BL21 (DE3) pLysS 
ont ete utilisees par soucis de comparaison avec les 
experiences pr^cedentes car 1' expression de la GST ou 
de ses chimdres ne necessite pas le systeme DE3-pLysS. 

L' induction de 1' expression a ete effectuee 
30 avec de 1'IPTG comme pour celle des domaines seuls. Les 
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caracteristiques des proteines produites sont resumees 
dans le tableau 2 suivant. 



Tableau 2 



Plasm ide 


Chimere, 
abreviation 


Construction 


Taille, 
aa 


Masse, 
Da 


pGEXKT 


GST, G 


1M-D239 t 


239 


27469 


pGEXKT-TI 


GST-TME1, 
GT1 


1 M-S233-347M-A383 


269 


30506 


PGEXKT-T2 


GST-TME2, 
GT2 


1M-S233-717E-A746 


263 


30191 



Les acides amines (aa) sont indiques avec le 
code a une lettre. La num6rotation des sequences est 
ef f ectuee par rapport aux proteines d' origine, GST et 

10 polyproteine virale. Celle qui fait reference aux 
domaines membranaires est indiqu6e en italiques . 

Les panneaux C et D de la figure 4 annex^e 
montrent les resultats obtenus . Les courbes de 
croissance des bact6ries transf orm6es avec les 

15 diff^rents plasmides montrent que 1' expression des 
chimeres GT1 et GT2 est toxique. Comme on peut le voir 
sur le gel d' 61ectrophordse de type Laemmli SDS-PAGE 
14% [24], 1' expression de TME1 fusionn6 & la GST 
s 9 accompagne de 1' absence de bande migrant k la taille 

20 attendue de 30 kDa. Ceci laisse supposer qu'un tr§s 
faible niveau d' expression de la chimere est suffisant 
pour tuer les bacteries. Par contre, la chimere GST- 
TME2 est cette fois visible sur le gel 
d' electrophoreses dans la zone de masse moleculaire 
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attendue de 30 kDa. Le niveau d' expression reste 
toutefois limits. 

La proteine produite n'est pas soluble malgre 
la presence de la GST dans la fusion- En effet, comme 
5 le montre la figure 6 annexee, les essais de 
solubilisation, repliement et purification de la 
chim£re GST-TME2 ont ete un fechec. 

Pour obtenir les resultats^representes sur cette 
figure 6, les* proteines GST et GST-TME2 ont ete 
10 . exprimees comme decrit sur la figure 4 a partir de 150 
ml de milieu de culture. Les bacteries ont ensuite ete 
r6coltees par centrifugation et suspendues KPO 4 20 mM 
pH 7.7, NaCl 0 . 1M, . EDTA 1 mM, NaN 3 1 mM) pour avoir 100 
DO/ml. Deux ml de chaque culture sont preleves pour 
15 sonication par pulses de 30 sec a 15% d' amplitude. 
Aprds sonication, Un prel&vement est effectue pour 
electrophorese . II correspond au puits « To » sur la 
figure 6 (correspondant au « total ») . 

Une premiere centrifugation & basse vitesse 
20 (SOOOxg, 15 minutes) permet de separer les bact§ries 
non cassees et les corps d' inclusion des proteines 
solubles ou membranaires . Ces dernieres se retrouvent 
dans le surnageant et un prelevement est effectue. II 
correspond au puits « Surn » sur la figure 6. 
25 La fraction contenant la GST seule est ensuite 

trait6e avec une resine d' affinity qui permet de fixer 
puis d'61uer specif iquement cette proteine (puits 
« Af » du gel GST sur la figure 6) . 

La fraction contenant la proteine non soluble 
30 GST-TME2 est trait£e soit avec un detergent doux comme 
le triton X100 (TX100), en presence ou en absence de 



WO 2004/027068 




T/FR2003/002763 



34 

NaCl, soit avec un detergent plus solubilisant mais 
plus destructurant comme le sarkosyl, avant d'etre ci 
nouveau diluee dans du TX100 et passee sur resine 
d' af finite . 

5 Les resultats de la figure 6 montrent que la GST 

est presente dans la fraction soluble, a la difference 
de la fusion GST-TME2, ce qui indique que cette 
derniere est insoluble. Le ^surnageant contenant la GST 
est passe sur une resine d' agarose-GSH capable de fixer 

10 la GST. Celle-ci est ensuite eluee avec un % exces de GSH 
(puits indique « Af » du gel GST sur la figure 6) . 

■ Le culot contenant la fusion GST-TME2 n'est pas 
solubilise en presence d'un detergent doux comme le 
TX100 (avec ou sans NaCl ajoute, puits « TX100 +/- 

15 NaCl » du gel GST-TME2) mais il peut etre solubilise 
avec un detergent plus agressif comme le sarkosyl. 
Cependant, apr6s dilution de la proteine ainsi 
solubilisee dans du TX100, un detergent doux qui doit 
favoriser son repliement, la proteine n'est pas retenue 

20 sur la resine d' af finite, contrairement a la GST, ce 
qui suggere que la proteine de fusion ne peut etre 
repliee . 

Ces tests indiquent de fagon claire que la 
proteine GST-TME2 est produite sous forme de corps 
25 d' inclusion que 1'on ne peut pas replier correctemeht . 

Exemple 4 : Expression de vecteurs d ; expression codant 
pour les proteines de fusion incluant un site Asp-Pro 
et un site GST 

30 La construction des vecteurs a 6te realisee 

comme decrit plus haut et pour les deux vecteurs codant 
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pour les proteines chimeres GST-TME1 et GST-TME2, pour 
donner naissance aux vecteurs codant pour les proteines 
chimeres GST-Asp-Pro-TMEl et GST-Asp-Pro-TME2 . Elles 
sont resumees dans le tableau 3 ci-dessous. 
5 Tableau 3 



. Plasmide 


Chimire ; 
Abriviation fig. 4 


Construction 


Taille, 
aa 


Masse, 
Da 


pGEXKT- 
dp-77 


G5T-DP-7^ET/ ; 
GvpTJ 


lM-S233 

AiS3 


271 


30718 


pGEXKT- 
. dp-T2 


GST-VP-TME2 ; 
Gd P 72 


lM-S233-dp-777E- 

A 7 « 


265 


30403 



Les acides amines (aa) sont indiques avec le 
code a une lettre. La numerotation des sequences est 
10 effectuee par rapport aux proteines d'origine, GST et 
polyproteine virale. Celle qui fait reference aux 
domaines membranaires est indiqu^e en italiques. 

Les vecteurs ont ete testes comme d6crit dans 
le paragraphe precedent. Les resultats obtenus sont 
15 illustr^s sur les panneaux E et F de la 'figure 4 
annexee . 

Les courbes de croissance des bact6ries 
transform6es avec les diff6rents plasmides montrent que 
1' expression des chimeres G d pTl et GdpT2 est nettement 
20 moins toxique que dans les cas precedents. Le panneau F 
montre que cette fois, TME1 est produite du fait de la 
presence du site de clivage DP. Son niveau 
d' expression, tel qu'on peut le voir dans le panneau F, 
est relativement moyen mais signif icatif . GST-DP-TME2 
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est nettement surproduit. Les deux proteines migrent 
dans leur zone de masse mol§culaire attendue . 

L' effet de 1' addition du dipeptide DP est aussi 
significatif qu' inattendu : il amplifie 1' expression 
5 des domaines et supprime leur toxicity. Cet effet 
d' attenuation de la toxicite n' est pas connu pour le 
dipeptide DP, dont la seule propri^te rapgortee a ce 
jour est sa capacite a §tre coupe par 1' acide formique. 
L'effet etant observe sur deux peptides differents et 
10 tous deux initialem^ht. toxiques pour la bacterie, on 
peut done raisonnablement penser que cette propriete 
peut s'etendre a d'autres peptides hydrophobes et 
toxiques . 

Les inventeurs ont verifi6 que le site peut 
15 etre ef f ectivement cliv6 par 1' acide formique : la 
coupure est lente et demande environ 7 jours a 
temperature ambiante . 

Les essais d' expression k basse temperature 
(20°C) pendant toute une nuit de ces chimeres ont 
20 permis de mettre en Evidence qu'elles sont produites 
sous forme native. En effet, il est possible de 
detecter une activite GST transferase dans la fraction 
membranaire des bact6ries . De plus, cette activite est 
mesur§e en solution lorsque les membranes sont 
25 solubilisfees en presence d'un detergent non ionique 
comme le (3-D dodecylmaltoside, apres centrif ugation. 
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Exemple 5 : Expression de vecteurs d' expression codant 
pour leg proteines de fusion incluanfc un site Asp-Pro 
et un site codant pour la thioredoxine (TrX) 

Les vecteurs d' expression pET32a-TrX, 
5 pET32a-TrX-dp-TMEl et pET32a-TrX-dp-TME2 ont et6 
construits comme d£crit ci-dessus et ont ete ensuite 
introduits dans les bacteries BL21 (DE3)pLysS. Les 
bacteries BL21 (DE3)pLysS ont ete utilises par soucis 
de comparaison avec les experiences pr6c6dentes car 
10 1' expression de la GST ou de ses chimeres he necessite 
pas le systeme DE3-pLysS. Les clones positifs ont 6te 
mis en culture et induits comme decrit ci-dessus. 

L' induction de 1' expression a ete effectuee 
avec de 1'I.PTG comme pour celle des domaines seuls. Les 
15 caracteristiques des proteines produites sont resumees 
dans le tableau 4 suivant. 



Tableau 4* 



Plasmide 


Chimere ; 
Abreviation fig. 4 


Construction 


Taille, 
aa 


Masse, 
Da 


pET32a 


Thioredoxine ; TrX 


1M-C189 


189 


20397 


pET32a- 
Gend-dp-T1 


TrX-DP-TME1 ; 
TdpT1 


1M-S115-PK- 

Gend-dp-Ti 


171 


17796 


pET32a- 
Gend-dp-T2 


TrX-DP-TME2 ; 
T DP T2 


1M-S115-PK- 
Gend-dp-T 2 


165 


17481 



* 2 Tl - TME1 et T2 « TME2 

20 

Les acides amines (aa) sont indiques avec le 
code a une lettre. La numerotation des sequences est 
effectuee par rapport aux proteines d'origine, GST et 
polyprot^ine virale. Celle qui fait reference aux 
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domaines membranaires est indiquee en italiques . 
« Gend » fait reference a la sequence C-terminale de la 
GST provenant des constructions avec le plasmide 
pGEXKT . Elle correspond a la sequence peptidique 
5 primaire SDLSGGGGGLVPRGS • Les chimeres thioredoxine- 
SDLSGGGGGLVPRGS-DP- (TME1 qu TME2) sont plus courtes que 
la proteine codee dans le vecteur d' origine car 
1' insertion est effectuee immediatement apres la 
thior^doxine . 

10. 

Sur la figure 5 : 

A : la croissance .bacterienne a 6te suivie en mesurant 
1 ' augmentation de turbidite de chaque culture par 
densite optique a 600 nm en fonction du temps, 
15 B : les bacteries ont 6te prelevees comme indiqu6 pour 
la figure 4 . Elles ont ensuite ete deposees sur gel 
d f electrophorese 14% d'acrylamide de type Laemmli 
SDS-PAGE et traitees comme indiqu6 pour la figure 4. 

20 Comme attendu, et comme le montrent les courbes 

de croissance representees sur la figure 5A annexee des 
bacteries transform§es avec les differents plasmides, 
1' expression des chimSres TrX-DP-TMEl et TrX-DP-TME2 
suivant la pr^sente invention n'est pas toxique. Le gel 

25 d' 61ectrophor6se represents sur la figure 5B annexe de 
type Laemmli SDS-PAGE 14% [24] montre que chaque 
chimfere est surproduite. 

La pr6sente invention permet done de fabriquer 
30 par recombinaison g6netique des peptides hydrophobes 
correspondant aux domaines membranaires des proteines 
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El et E2 de l'enveloppe du virus de 1' hepatite C, dont 
1' expression a ete reconnue comme letale dans les 
techniques de l'art anterieur. En outre, 1' ef f et etant 
observe sur deux peptides vraiment differents et tous 
5 deux initialement toxiques pour la bacterie, indique 
que la presente invention concerne d' autres peptides 
hydrophobes et toxiques. 

Exemple 6 : Effet du dipeptide DP siir la toxicide des . 
10 domaines transnembranaires TME1 et TME2 exprimes sans 
proteine de fusion dans la bacteria . 

Cet exemple permet d'evaluer l'effet antitoxique 
du dipeptide DP insert en absence de proteine de fusion 
GST ou TrX conf ornament a la revendication 1 annexee. 

15 

A) Materiels : Les plasmides pT7-7-pt TM Ei et pT7- 
7-ptrME2 sont ceux qui sont d£crits dans 1' exemple 1. 
Les plasmides pT7-7 -dp -pt-mEi et pT7-7-dp-pt TM E2 ont ete 
construits et clones dans pT7-7 (SEQ IDn°33) comme 
20 decrits dans 1' exemple 1 mais en utilisant les sites 
Nde I (5') et EcoR I (3') du plasmide. Les 
oligonucleotides amont (5') intdgrent la sequence dp 
(gacccg) apr&s la lere methionine (atg) . Les matrices 
utilisees pour gen6rer chaque ADN ont ete les plasmides 
25 pT7-7-pt T MEi et pT7-7-ptTME2 - Les sequences ont- ete 
verifi£es apr&s clonage. 

Les oligonucleotides utilises sont les 

suivants : 

i) Clonage de la sequence codant pour (M)DP- 
30 TMEi dans pT7-7: 
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OL19 ( + ) : 5'- CG CATATGGACCCGATCGCTGGTGCT -3' 
[Nde I souligne) = (SEQ IDn°15 de la liste de sequences 
annexee) ; 

OL20 (-) : 5' -GAATTCCTAAGCGTCAACACCAGC-3' (EcoR 
5 I souligne) = (SEQ IDn°16 de la liste de sequences 
annexee) . 

ii) Clonage de la sequence codant pour (M)DP- 
TME2 dans pT7-7: 

OL2 8 ( + ) : 5 ' - CGCATATGGACCCGGAATACGTTGTTC- 3 ' 
10 (Nde I *soulign£) = (SEQ IDn°26 de la liste de sequences 
annexee) ; 

OL29 (-) : 5 9 -CAGAATTCCTAAGCTTCAGCCTGAGAG- 3 ' 
(EcpR I souligne) - (SEQ IDn°27 de la liste de 
sequences annexee) . 

15 

Les vecteurs d' expressions pT7 -7- dp -pt T MEi et 
pT7-7-dp-ptTME2 obtenus sont presentes sur la liste de 
sequences annexee (SEQ IDn°44 et SEQ IDn°45) . 

20 B) Legende des Figure s 7 A et B annexees : la 

souche bact^rienne BL21 (DE3) pLysS a ete transf ormee 
soit avec le plasmide seul soit avec les diff6rentes 
versions de pT7-7 integrant les 4 constructions 
exprimant TME1, M -DP-TME1 (figure 7A) ou TME2, M-DP- 

25 TME2 (figure 7B) . M represente la methionine, elle est 
pr6sente en position N-terminale des peptides lorsque 
les prolines toxiques sont fabriquees suivant la 
presente invention avec le plasmide pT7-7. 

. La croissance des differents clones a et6 

30 comparee apres induction par l'IPTG, suivant le 
protocole identique k 1' induction chimique decrite dans 



WO 2004/027068 



T/FR2003/002763 



41 

l'exemple 2, et moyennee sur les valeurs de DO de 4 
clones differents pour chaque construction. 

C) Resultats: 

5 Les figures 7A et 7B montrent que les 

bacteries ayant un plasmide exprimant des prot§ines 
TME1 et TME2 croissent moins vite apres induction que 
la souche temoin qui est trans formee avec. le vecteur 
pT7-7 seul. 

10 r Ces resultats montrent que les souches 

transformees avec les plasmides exprimant les versions 
M-DP-TME1 (SEQ IDn°50) et M-DP-TME2 (SEQ IDn°51) selon 
l r invention croissent signif icativement mieux que 
celles qui expriment les TM sans DP. Ceci est vrai pour 

15 TMEl et encore plus nettement pour TME2. 

La conclusion est que 1' insertion N-terminale 
de DP conformement & la presente invention contribue de 
maniere surprenante a une diminution significative de 
la toxicite de 1' expression des domaines membranaires, 

20 notamment en absence d' une proteine de fusion soluble 
comme la GST ou la thior^doxine . 
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REVEND I CAT I ON S 

1. Systeme d' expression caracterise en ce 
qu'il comprend successivement, dans le sens 5' -3' , une 
5 sequence nucleotidique codant pour le dipeptide Asp-Pro 
et une sequence nucleotidique codant pour une proteine 
toxique membranaire ou un domaine d'une proteine 
toxique membranaire. 

10 2. Systeme d' expression selon la revencfication. 

1, dans lequel la proteine toxique. est une proteine 
membranaire oii un domaine d'une proteine membranaire 
d'une enveloppe de virus . 

15 3, Systeme d' expression selon la revendication 

2, dans lequel le virus est choisi parmi le virus de 
1' hepatite C, le virus du sida, un virus pathogdne pour 
l'homme, un virus pathogene pour un mammifere. 

20 4. Systeme d' expression selon la revendication 

1, dans lequel la proteine toxique est une proteine 
transmembranaire ou un domaine d'une proteine 
transmembranaire du virus de 1' hepatite C. 

25 5. Systeme d' expression selon la revendication 

1, dans lequel la proteine toxique est une proteine de 
sequence IDn°l ou IDn°2 de la liste de sequences 
annex6e . 

30 6. Systeme d' expression selon la revendication 

1, dans lequel la sequence nucleotidique codant pour la 
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proteine toxique est choisie parmi la sequence IDn°3 et 
la sequence IDn°4 de la liste de sequences annexee. 

7. Systeme d' expression selon la revendication 
5 6, dans lequel la . sequence nucl^otidique codant pour le 

dipeptide Asp-Pro est gacccg. 

8. Systfeme d' expression selon la revendication 
1, comprenant en outre, en amont "de la sequence Asp- 

10 Pro, une sequence nucleqtidique codant pour une 
prot6ine soluble. 

9. Systeme d' expression selon la revendication 
8, dans lequel la proteine soluble est la glutathion S- 

15 transferase ou la thioredoxine . 

10. Systeme d' expression selon la revendication 
1, codant pour une proteine de fusion ayant une 
sequence choisie dans le groupe constitue des sequences 

20 IDn°46, IDn°47, IDn°48, IDn°49, IDn°50 et IDn°51 de la 
liste de sequences annexee. 

11. Systeme d' expression selon la revendication 
8, ledit systeme ayant une sequence choisie dans le 

25 groupe constitu6 des sequences IDn°34, IDn°35, IDn°36 / 
IDn°37, IDn°38 / et IDn°39 de la liste de sequences 
annexee . 

12. Vecteur d' expression bacterien comprenant 
30 un systeme d' expression selon l'une quelconque des 

revendications 1 A 11 clone dans un plasmide . 
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13. Vecteur d' expression bacterien comportant 
un systeme d' expression selon l'une quelconque des 
revendications 1 a 9 et la sequence oligonucleotidique 

5 du plasmide pT7-7. 

14. Vecteur d f expression bacterien constitu6 de 
la sequence IDn°44 ou IDn°45 de la liste de sequences 
annexee . 

10 < » 

15. - Vecteur d' expression bacterien comportant 
un systeme d' expression selon l'une quelconque des 
revendications 1 a 7 et la sequence oligonucleotidique 
d'un plasmide choisi parmi pGEXKT, pET32a. 

15 

16. Vecteur d' expression bacterien selon la 
revendication 15 constitu6 d'une sequence choisie dans 
le groupe constitue des sequences IDn°40, IDn°41, 
IDn°42 et IDn°43 de la liste de sequences annexees. 

20 

17. Cellule procaryote transformee par un 
vecteur d' expression selon l'une quelconque des 
revendications 12 a 16. 

.25 18 . Cellule procaryote E. coli selon la 

revendication 17 . 

19. Procedfe de fabrication d'une prot6ine 
toxique par recombinaison g6n6tique comprenant les 
30 etapes suivantes : 
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transformer une cellule hote avec un 
systeme d' expression selon la revendication 1 ou avec 
un vecteur d' expression selon la revendication 12, 

cultiver la cellule hote transformee dans 
5 des conditions de culture telles qu'elle fabrique une 
proteine de fusion comprenant le dipeptide Asp-Pro 
suivi de la sequence peptidique de la proteine toxique 
£ partir dudit vecteur d f expression, et 

isoler ladite proteine de fusion. 

10 

20. Procede selon la revendication 19 , 
comprenant en outre une 6tape consistant a cliver 
ladite prot6ine de fusion pour recuperer la proteine 
toxique. 

15 

21. Procede selon la revendication 20, dans 
lequel 1'etape consistant £ cliver ladite proteine de 
fusion pour recuperer la proteine toxique est realisee 
en faisant agir de 1'acide formique sur la proteine de 

20 fusion. 

22. Proc6d§ selon la revendication 19, dans 
lequel la cellule hote est E. coli. . 

25 23. Procede selon la revendication 19, dans 

lequel le systSme d' expression code pour une proteine 
de fusion ayant une sequence choisie dans le groupe 
constitue des sequences IDn°46, IDn°47, IDn°48, IDn°49, 
IDn°50 et IDn°51 de la liste de sequences annexee. 



30 
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24. Precede selon la revendication 19, dans 
lequel le systeme d' expression a une sequence choisie 
dans le groupe constitue des sequences IDn°34, IDn°35 / 
IDn°36, IDn°37, IDn°38, et IDn°39 de la liste de 

5 sequences annexee . 

25. Procede selon la revendication 19, dans 
lequel le vecteur d' expression est constitue d'une 
sequence choisie dans le groupe. constitue des sequences 

10 IDn°40, IDn°41, IDn°42, IDn°43, IDn°44 et IDn°45 de la 
liste de sequences annexees . 

26. Proteine de fusion ayant une sequence 
peptidique choisie dans le groupe constitue des 

15 sequences IDn°46, IDn°47 IDn°48, IDn°49, IDn°50 et 
I.Dn°51 de la liste de sequences annexee. 
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LISTS DE SEQUENCES 

<110> CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE 

<120> SYSTEMES D 1 EXPRESSION DE PROTEINES TOXIQUES, VECTEURS 
ET PROCEDE DE FABRICATION DE PROTEINES TOXIQUES 

<130> B14143 EE 

<I40> 
<141> 

<150> PR N°02 11676 
<151> 2002-09-20 

<160> 53 

<170> Patentln Ver. 2.1 

<210> 1 • * 

<211> 37 
<212> PRT 

<213> Hepatitis C virus 
<400> 1 

Met lie Ala Gly Ala His Trp Gly Val Leu Ala Gly lie Ala Tyr Phe 
15 10 .15 

Ser Met Val Gly Asn Trp Ala Lys Val Leu Val Val Leu Leu Leu Phe 
20 25 30 

Ala Gly Val Asp Ala 
35 



<210> 2 
<211> 31 
<212> PRT 

<213> Hepatitis C virus 
<400> 2 

Met Glu Tyr Val Val Leu Leu Phe Leu Leu Leu Ala Asp Ala Arg Val 
15 10 15 

Cys Ser Cys Leu Trp Met Met Leu Leu lie Ser Gin Ala Glu Ala 
20 25 30 



<210> 3 
<211> 111 
<212> ADN 

<213> Hepatitis C virus 
<400> 3 

atgatcgctg gtgctcactg gggtgttctg gctggtatcg cttacttctc tatggttggt 60 
aactgggcta aagttctggt tgttctgctg ctgttcgctg gtgttgacgc t 111 



<210> 4 
<211> 93 
<212> ADN 



1 
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<213> Hepatitis C virus 
<400> 4 

atggaatacg ttgttctgct gttcctgctg ctggctgacg ctcgtgtttg ctcttgcctg 60 
tggatgatgc tgctgatctc tcaggctgaa get 93 

<210> 5 
<211> 24 
<212> ADN 

<213> Sequence artif icielle 
<220> 

<223> Description de la sequence artif icielle : 

oligonucleotide (+) d» insertion dans pT7-7 

<400> 5 

gggaatgeca tatgatcget . ggtg 24 

<210> 6 
<211> 23 

<212> ADN m 
<213> Sequence" artif icielle 



<220> 

<223> Description de la sequence artif icielle : 

oligonucleotide <-) d 1 insertion dans pT7-7 

<400> 6 

gcatatcgat etaagegtea aca 23 



<210> 7 
<211> 131 
<212> ADN 

<213> Sequence artif icielle 
<220> 

<223> Description de la sequence artif icielle ; ADN sens 
codant de TME1 + site cla I en 3 1 

<400> 7 

atgccatatg atcgctggtg ctcactgggg tgttctggct ggtatcgett acttctctat 60 

ggttggtaac tgggctaaag ttctggttgt tetgetgetg ttcgctggtg ttgaegctta 120 

gatcgatatg c 131 



<210> 8 
<211> 131 
<212> ADN 

<213> Sequence artif icielle 
<220> 

<223> Description de la sequence artif icielle : ADN sens 
anticodant + site cla I en 5 1 

<400> 8 

gcatatcgat etaagegtea acaccagcga acagcagcag aacaaccaga actttagccc 60 
agttaccaac catagagaag taagegatae cagccagaac accccagtga gcaccagcga 120 
tcatatggca t 131 
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<210> 9 
<211> 74 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

Oligonucleotide sens codant de pour la synthese de 



<400> 9 

atgccatatg atcgctggtg ctcactgggg tgttctggct ggtatcgctt acttctctat 60 



^10> 10 
♦ll> 79 
x*X2> ADN 

«213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucleotide sens ahticodant pour la synthase 
de TME1 

<400> 10 

gcatatcgat ctaagcgtca acaccagcga acagcagcag aacaaccaga actttagccc 60 
agttaccaac catagagaa 79 



<210> 11 
<211> 22 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucleotide ( + ) d* insertion dans pGEXKT sans 



<210> 12 
<211> 28 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucleotide (+) d' insertion dans pGEXKT avec 
site dp 

<400> 12 

ggatccgacc cgatggaata cgttgttc 28 



TME1 



Wttggtaac tggg 



74 



site dp 



<400> 11 

ggatccatgg aatacgttgt tc 



22 



<210> 13 
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<211> 23 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucleotide (-) d 1 insertion dans pGEXKT 

<400> 13 

gaattcctaa gcttcagcct gag 



<210> 14 
<211> 27 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucleotide (+) de transfert dans pET32 

<400> 14 ^ 
gtgatatctg atctgtctgg tggtggt 

<210> 15 
<211> 26 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucleotide (+) d 1 insertion dans pT7-7 

<400> 15 

cgcatatgga cccgatcgct ggtgct 



<210> 16 
<211> 24 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucleotide (-) d 1 insertion dans pT7-7 

<400> 16 

gaattcctaa gcgtcaacac cage 



<210> 17 
<211> 19 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucl§otide (+) d'insertioon dans pT7-7 



<400> 17 
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catatggaat acgttgttc 19 



<210> 18 
<211> 28 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucleotide (-) d'insertioon dans pT7-7 

<400> 18 

aagcttaagc ttcagcctga gagatcag 28 

<210> 19 
<211> 103 
<212> adn 

<213> Sequence artificielle 

<220> £r 

<223> Description de la sequence artificielle: ADN sens 
codant pour TME2 + site Nde I en 5 1 et Hind III en 
3* 

<400> 19 

catatggaat acgttgttct gctgttcctg ctgctggctg acgctcgtgt ttgctcttgc 60 
ctgtggatga tgctgctgat ctctcaggct gaagcttaag ctt 103 



<210> 20 
<211> 103 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: ADN sens 
anticodant de TME2 + site Nde I en 3 1 et Hind III 
en 5» 

<400> 20 

aagcttaagc ttcagcctga gagatcagca gcatcatcca caggcaagag caaacacgag 60 
cgtcagccag cagcaggaac agcagaacaa cgtattccat atg 103 

<210> 21 
<211> 68 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucleotide sens codant (+) pour la synthase 
de TMB2 

<400> 21 

catatggaat acgttgttct gctgttcctg ctgctggctg acgctcgtgt ttgctcttgc 60 
ctgtggat 68 
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<210> 22 
<211> 57 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucleotide sens codant (-) pour la synthase 
de TME2 

<400> 22 

aagcttaagc ttcagcctga gagatcagca gcatcatcca caggcaagac gaaacac 57 

<210> 23 
<211> 19 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de \& sequence artificielle: 

oligonucleotide (+) d 1 insertion dans pGEXKT sans 
site dp 

<400> 23 

ggatccgaat acgttgttc 19 

<210> 24 
<211> 25 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucleotide (+) d 1 insertion dans pGEXKT avec 
site dp 

<400> 24 

ggatccgacc cggaatacgt tgttc 25 

<210> 25 
<211> 30 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucleotide (-) d« insertion dans pGEXKT avec 
site dp 

<400> 25 

gaattcttaa gcttcagcct gagagatcag 30 

<210> 26 
<211> 27 
<212> ADN 

<213> sequence artificielle 
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<220> 

<223> Description de la sequence art if icielle : 

oligonucleotide (+) d* insertion dans pT7-7 



<400> 26 

cgcatatgga cccggaatac gttgttc 



27 



<210> 27 
<211> 27 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 

oligonucleotide (-) d' insertion dans pT7-7 

<400> 27 t0 
cagaattcct aagcttcagc ctgagag 27 



<210> 28 
<211> 15 

<212> PRT ^ '* 

<213> Sequence artificielle 

<220> 

<223> Description de la sequence artificielle: fin de la 
GST suivie du site thrombine 

<400> 28 

Ser Asp Leu Ser Gly Gly Gly Gly Gly Leu Val Pro Arg Gly Ser 
15 10 15 



<210> 29 
<211> 717 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: ADN 

codant pour la proteine GST dans le vecteur pGEXKT 

<400> 29 

atgtccccta tactaggtta ttggaaaatt aagggccttg tgcaacccac tcgacttctt 60 
ttggaatatc ttgaagaaaa atatgaagag catttgtatg agcgcgatga aggtgataaa 120 
tggcgaaaca aaaagtttga attgggtttg gagtttccca atcttcctta ttatattgat 180 
ggtgatgtta aattaacaca gtctatggcc atcatacgtt atatagctga caagcacaac 240 
atgttgggtg gttgtccaaa agagcgtgca gagatttcaa tgcttgaagg agcggttttg 300 
gatattagat acggtgtttc gagaattgca tatagtaaag actttgaaac tctcaaagtt 360 
gattttctta gcaagctacc tgaaatgctg aaaatgttcg aagatcgttt atgtcataaa 420 
acatatttaa atggtgatca tgtaacccat cctgacttca tgttgtatga cgctcttgat 480 
gttgttttat acatggaccc aatgtgcctg gatgcgttcc caaaattagt ttgttttaaa 540 
aaacgtattg aagctatccc acaaattgat aagtacttga aatccagcaa gtatatagca 600 
tggcctttgc agggctggca agccacgttt ggtggtggcg accatcctcc aaaatcggat 660 
ctgtctggtg gtggtggtgg tctggttccg cgtggatccc cgggaattca tcgtgac 717 



<210> 30 
<211> 327 
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<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artif icieile : ADN 
codant pour la thiorSdoxine dans le vecteur 
pET32a+ 



<400> 30 

atgagcgata 

gacggggcga 

ccgattctgg 

atcgatcaaa 

ctgttcaaaa 

aaagagttcc 



aaattattca 
tcctcgtcga 
atgaaatcgc 
accctggcac 
acggtgaagt 
tcgacgctaa 



cctgactgac 
tttctgggca 
tgacgaatat 
tgcgccgaaa 
ggcggcaacc 
cctggcc 



gacagttttg 
gagtggtgcg 
cagggcaaac 
tatggcatcc 
aaagtgggtg 



acacggatgt 
gtccgtgcaa 
tgaccgttgc 
gtggtatccc 
cactgtctaa 



actcaaagcg 60 
aatgatcgcc 120 
aaaactgaac 180 
gactctgctg 240 
aggtcagttg 300 
327 



<210> 31 

<211> 4969 * 9 * 

<212> ADN * <*> 

<213> Sequence artificielle 

<220> 

<223> Description de la sequence artificielle: 
d 1 expression pGEXKT 



plasmide 



<400> 31 

acgttatcga 

gtatggctgt 

tctggataat 

tgttgacaat 

cacaggaaac 

aacccactcg 

gcgatgaagg 

ttccttatta 

tagctgacaa 

ttgaaggagc 

ttgaaactct 

atcgtttatg 

tgtatgacgc 

aattagtttg 

ccagcaagta 

atcctccaaa 

gaattcatcg 

tctgacacat 

gacaagcccg 

agtcacgtag 

tatttttata 

ggggaaatgt 

cgctcatgag 

gtattcaaca 

ttgctcaccc 

tgggttacat 

aacgttttcc 

ttgacgccgg 

agtactcacc 

gtgctgccat 

gaccgaagga 

gttgggaacc 

cagcaatggc 

ggcaacaatt 



ctgcacggtg 
gcaggtcgta 
gttttttgcg 
taatcatcgg 
agtattcatg 
acttcttttg 
tgataaatgg 
tattgatggt 
gcacaacatg 
ggttttggat 
caaagttgat 
tcataaaaca 
tcttgatgtt 
ttttaaaaaa 
tatagcatgg 
atcggatctg 
tgactgactg 
gcagctcccg 
tcagggcgcg 
cgatagcgga 
ggttaatgtc 
gcgcggaacc 
acaataaccc 
tttccgtgtc 
agaaacgctg 
cgaactggat 
aatgatgagc 
gcaagagcaa 
agtcacagaa 
aaccatgagt 
gctaaccgct 
ggagctgaat 
aacaacgttg 
aatagactgg 



caccaatgct 
aatcactgca 
ccgacatcat 
ctcgtataat 
tcccctatac 
gaatatcttg 
cgaaacaaaa 
gatgttaaat 
ttgggtggtt 
attagatacg 
tttcttagca 
tatttaaatg 
gttttataca 
cgtattgaag 
cctttgcagg 
tctggtggtg 
acgatctgcc 
gagacggtca 
tcagcgggtg 
gtgtataatt 
atgataataa 
cctatttgtt 
tgataaatgc 
gcccttattc 
gtgaaagtaa 
ctcaacagcg 
acttttaaag 
ctcggtcgcc 
aagcatctta 
gataacactg 
tttttgcaca 
gaagccatac 
cgcaaactat 
atggaggcgg 



tctggcgtca 
taattcgtgt 
aacggttctg 
gtgtggaatt 
taggttattg 
aagaaaaata 
agtttgaatt 
taacacagtc 
gtccaaaaga 
gtgtttcgag 
agctacctga 
gtgatcatgt 
tggacccaat 
ctatcccaca 
gctggcaagc 
gtggtggtct 
tcgcgcgttt 
cagcttgtct 
ttggcgggtg 
cttgaagacg 
tggtttctta 
tatttttcta 
ttcaataata 
ccttttttgc 
aagatgctga 
gtaagatcct 
ttctgctatg 
gcatacacta 
cggatggcat 
cggccaactt 
acatggggga 
caaacgacga 
taactggcga 
ataaagttgc 



ggcagccatc 
cgctcaaggc 
gcaaatattc 
gtgagcggat 
gaaaattaag 
tgaagagcat 
gggtttggag 
tatggccatc 
gcgtgcagag 
aattgcatat 
aatgctgaaa 
aacccatcct 
gtgcctggat 
aattgataag 
cacgtttggt 
ggttccgcgt 
cggtgatgac 
gtaagcggat 
tcggggcgca 
aaagggcctc 
gacgtcaggt 
aatacattca 
ttgaaaaagg 
ggcattttgc 
agatcagttg 
tgagagtttt 
tggcgcggta 
ttctcagaat 
gacagtaaga 
acttctgaca 
tcatgtaact 
gcgtgacacc 
actacttact 
aggaccactt 



ggaagctgtg 

gcactcccgt 

tgaaatgagc 

aacaatttca 

ggccttgtgc 

ttgtatgagc 

tttcccaatc 

atacgttata 

atttcaatgc 

agtaaagact 

atgttcgaag 

gacttcatgt 

gcgttcccaa 

tacttgaaat 

ggtggcgacc 

ggatccccgg 

ggtgaaaacc 

gccgggagca 

gccatgaccc 

gtgatacgcc 

ggcacttttc 

aatatgtatc 

aagagtatga 

cttcctgttt 

ggtgcacgag 

cgccccgaag 

ttatcccgtg 

gacttggttg 

gaattatgca 

acgatcggag 

cgccttgatc 

acgatgcctg 

ctagcttccc 

ctgcgctcgg 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 
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cccttccggc tggctggttt attgctgata aatctggagc cggtgagcgt gggtctcgcg 2100 
gtatcattgc agcactgggg ccagatggta agccctcccg tatcgtagtt atctacacga 2160 
cggggagtca ggcaactatg gatgaacgaa atagacagat cgctgagata ggtgcctcac 2220 
tgattaagca ttggtaactg tcagaccaag tttactcata tatactttag attgatttaa 2280 
aacttcattt ttaatttaaa aggatctagg tgaagatcct ttttgataat ctcatgacca 2340 
aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag 2400 
gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac 2460 
cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa 2520 
ctggcttcag cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc 2580 
jccacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag 2640 

$gctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac 2700 
cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc 2760 
gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc 2B20 
ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca 2880 
^agggagct tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc 2940 
tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg 3000 
«:agcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct 3060 
*«.ectgcgtt atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata 3120 

ogctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc 3180 
j^cctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc ataaattccg 3240 
Acaccatcga atggtgcaaa acctttcgcg gtatggcatg atagcgcccg gaagagagtc 3300 
aattcagggt ggtgaatgtg aaaccagtaa cgttatacga tgtcgcagag tatgccggtg 3360 
tctcttatca gaccgtttcc cgcgtggtga accaggccag ccacgtttct gcgaaaacgc 3420 
gggaaaaagt ggaagcggcg atggcggagc tgaattacat tcccaaccgc gtggcacaac 3480 
aactggcggg caaacagtcg ttgctgattg gcgttgccac ctccagtctg gccctgcacg 3540 
cgccgtcgca aattgtcgcg gcgattaaat ctcgcgccga tcaactgggt gccagcgtgg 3600 
tggtgtcgat ggtagaacga agcggcgtcg aagcctgtaa agcggcggtg cacaatcttc 3660 
tcgcgcaacg cgtcagtggg ctgatcatta actatccgct ggatgaccag gatgccattg 3720 
ctgtggaagc tgcctgcact aatgttccgg cgttatttct tgatgtctct gaccagacac 3780 
ccatcaacag tattattttc tcccatgaag acggtacgcg actgggcgtg gagcatctgg 3840 
tcgcattggg tcaccagcaa atcgcgctgt tagcgggccc attaagttct gtctcggcgc 3900 
gtctgcgtct ggctggctgg cataaatatc tcactcgcaa tcaaattcag ccgatagcgg 3960 
aacgggaagg cgactggagt gccatgtccg gttttcaaca aaccatgcaa atgctgaatg 4020 
agggcatcgt tcccactgcg atgctggttg ccaacgatca gatggcgctg ggcgcaatgc 4080 
gcgccattac cgagtccggg ctgcgcgttg gtgcggatat ctcggtagtg ggatacgacg 4140 
ataccgaaga cagctcatgt tatatcccgc cgttaaccac catcaaacag gattttcgcc 4200 
tgctggggca aaccagcgtg gaccgcttgc tgcaactctc tcagggccag gcggtgaagg 4260 
gcaatcagct gttgcccgtc tcactggtga aaagaaaaac caccctggcg cccaatacgc 4320 
aaaccgcctc tccccgcgcg ttggccgatt cattaatgca gctggcacga caggtttccc 4380 
gactggaaag cgggcagtga gcgcaacgca attaatgtga gttagctcac tcattaggca 4440 
ccccaggctt tacactttat gcttccggct cgtatgttgt gtggaattgt gagcggataa 4500 
caatttcaca caggaaacag ctatgaccat gattacggat tcactggccg tcgttttaca 4560 
acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat cgccttgcag cacatccccc 4620 
tttcgccagc tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg 4680 
cagcctgaat ggcgaatggc gctttgcctg gtttccggca ccagaagcgg tgccggaaag 4740 
ctggctggag tgcgatcttc ctgaggccga tactgtcgtc gtcccctcaa actggcagat 4800 
gcacggttac gatgcgccca tctacaccaa cgtaacctat cccattacgg tcaatccgcc 4860 
gtttgttccc acggagaatc cgacgggttg ttactcgctc acatttaatg ttgatgaaag 4920 
ctggctacag gaaggccaga cgcgaattat ttttgatggc gttggaatt 4969 



<210> 32 
<211> 11800 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: plasmide 
d 1 expression pET32a+ 

<400> 32 
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atccggatat agttcctcct 
ggggttatgc tagttattgc 
aagtcgtttt ttggggagtt 
agtcgccacc gtcgtcggtt 
tggtggtggt ggtggtgctc 
gagtcgaagg aaagcccgaa 
ctcacgccgg cgttcgaaca 
tgtcgtcgtc gtcggtaccc 
cagcggtttc tttcatacca 
tctagacccg acaggtacac 
gaaccgcgtg gcaccagacc 
gaaccggcca ggttagcgtc 
tcttcttact actactacta 
ctccttgaga aagttgactg 
gtttttgaac agcagcagag 
gaaatctgtc acgtgggtga 
agccctatgg tgcctacggt 
ttgcaacggt cagtttgccc 
ttttgcacgg accgcaccacr caaaactagc tacaagtcaa aacgttgcca gtcaaacggg 1140 
actataagca .gtcgctaaag taggtcttag ccccgctagt aaaacgtgcc tggcgtggtg 1200 
tctgcccaga aatcgacgag gatcgccccg tccgctttga gtacatccgt gtcaaaactg 1260 
tcgtcagtca ggtgaataat tttatcgctc atatgtatat agacgggtct ttagctgctc 1320 
ctagcggggc aggcgaaact catgtaggca cagttttgac agcagtcagt ccacttatta 1380 
aaatagcgag tatacatata ctccttctta aagttaaaca aaattatttc tagaggggaa 1440 
ttgttatccg ctcacaattc ccctatagtg agtcgtatta atttcgcggg atcgagatcg 1500 
gaggaagaat ttcaatttgt tttaataaag atctcccctt aacaataggc gagtgttaag 1560 
gggatatcac tcagcataat taaagcgccc tagctctagc atctcgatcc tctacgccgg 1620 
acgcatcgtg gccggcatca ccggcgccac aggtgcggtt gctggcgcct atatcgccga 1680 
catcaccgat ggggaagatc tagagctagg agatgcggcc tgcgtagcac cggccgtagt 1740 
ggccgcggtg tccacgccaa cgaccgcgga tatagcggct gtagtggcta ccccttctag 1800 
gggctcgcca cttcgggctc atgagcgctt gtttcggcgt gggtatggtg gcaggccccg 1860 
tggccggggg actgttgggc gccatctcct tgcatgcacc cccgagcggt gaagcccgag 1920 
tactcgcgaa caaagccgca cccataccac cgtccggggc accggccccc tgacaacccg 1980 
cggtagagga acgtacgtgg attccttgcg gcggcggtgc tcaacggcct caacctacta 2040 
ctgggctgct tcctaatgca ggagtcgcat aagggagagc gtcgagatcc cggacaccat 2100 
taaggaacgc cgccgccacg agttgccgga gttggatgat gacccgacga aggattacgt 2160 
cctcagcgta ttccctctcg cagctctagg gcctgtggta cgaatggcgc aaaacctttc 2220 
gcggtatggc atgatagcgc ccggaagaga gtcaattcag ggtggtgaat gtgaaaccag 2280 
taacgttata cgatgtcgca gcttaccgcg ttttggaaag cgccataccg tactatcgcg 2340 
ggccttctct cagttaagtc ccaccactta cactttggtc attgcaatat gctacagcgt 2400 
gagtatgccg gtgtctctta tcagaccgtt tcccgcgtgg tgaaccaggc cagccacgtt 2460 
tctgcgaaaa cgcgggaaaa agtggaagcg gcgatggcgg ctcatacggc cacagagaat 2520 
agtctggcaa agggcgcacc acttggtccg gtcggtgcaa agacgctttt gcgccctttt 2580 
tcaccttcgc cgctaccgcc agctgaatta cattcccaac cgcgtggcac aacaactggc 2640 
gggcaaacag tcgttgctga ttggcgttgc cacctccagt ctggccctgc acgcgccgtc 2700 
tcgacttaat gtaagggttg gcgcaccgtg ttgttgaccg cccgtttgtc agcaacgact 2760 
aaccgcaacg gtggaggtca gaccgggacg tgcgcggcag gcaaattgtc gcggcgatta 2820 
aatctcgcgc cgatcaactg ggtgccagcg tggtggtgtc gatggtagaa cgaagcggcg 2880 
tcgaagcctg taaagcggcg cgtttaacag cgccgctaat ttagagcgcg gctagttgac 2940 
ccacggtcgc accaccacag ctaccatctt gcttcgccgc agcttcggac atttcgccgc 3000 
gtgcacaatc ttctcgcgca acgcgtcagt gggctgatca ttaactatcc gctggatgac 3060 
caggatgcca ttgctgtgga agctgcctgc actaatgttc cacgtgttag aagagcgcgt 3120 
tgcgcagtca cccgactagt aattgatagg cgacctactg gtcctacggt aacgacacct 3180 
tcgacggacg tgattacaag cggcgttatt tcttgatgtc tctgaccaga cacccatcaa 3240 
cagtattatt ttctcccatg aagacggtac gcgactgggc gtggagcatc tggtcgcatt 3300 
gccgcaataa agaactacag agactggtct gtgggtagtt gtcataataa aagagggtac 3360 
ttctgccatg cgctgacccg cacctcgtag accagcgtaa gggtcaccag caaatcgcgc 342 0 
tgttagcggg cccattaagt tctgtctcgg cgcgtctgcg tctggctggc tggcataaat 3480 
atctcactcg caatcaaatt cccagtggtc gtttagcgcg acaatcgccc gggtaattca 3540 
agacagagcc gcgcagacgc agaccgaccg accgtattta tagagtgagc gttagtttaa 3600 
cagccgatag cggaacggga aggcgactgg agtgccatgt ccggttttca acaaaccatg 3660 
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ttcagcaaaa aacccctcaa gacccgttta gaggccccaa 60 
tcagcggtgg cagcagccaa taggcctata tcaaggagga 120 
ctgggcaaat ctccggggtt ccccaatacg atcaataacg 180 
ctcagcttcc tttcgggctt tgttagcagc cggatctcag 240 
gagtgcggcc gcaagcttgt cgacggagct cgaattcgga 300 
acaatcgtcg gcctagagtc accaccacca ccaccacgag 360 
gctgcctcga gcttaagcct tccgatatca gccatggcct 420 
agatctgggc tgtccatgtg ctggcgttcg aatttagcag 480 
aggctatagt cggtaccgga acagcagcag cagccatggg 540 
gaccgcaagc ttaaatcgtc gtcgccaaag aaagtatggt 600 
. agaagaatga tgatgatgat ggtgcatatg gccagaacca 660 
gaggaactct ttcaactgac cttggcgcac cgtggtctgg 720 
ccacgtatac cggtcttggt cttggccggt ccaatcgcag 780 
ctttagacag tgcacccact ttggttgccg ccacttcacc 840 
tcgggatacc acggatgcca tatttcggcg cagtgccagg 900 
aaccaacggc ggtgaagtgg caaaaacttg tcgtcgtctc 960 
ataaagccgc gtcacggtcc gttttgatcg atgttcagtt 1020 
tgatattcgt cagcgatttc atccagaatc crgagcgatca 1080 
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caaatgctga atgagggcat cgttcccact gcgatgctgg gtcggctatc gccttgccct 3720 
tccgctgacc tcacggtaca ggccaaaagt tgtttggtac gtttacgact tactcccgta 3780 
gcaagggtga cgctacgacc ttgccaacga tcagatggcg ctgggcgcaa tgcgcgccat 3840 
taccgagtcc gggctgcgcg ttggtgcgga catctcggta gtgggatacg acgataccga 3900 
aacggttgct agtctaccgc gacccgcgtt acgcgcggta atggctcagg cccgacgcgc 3960 
aaccacgcct gtagagccat caccctatgc tgctatggct agacagctca tgttatatcc 4020 
cgccgttaac caccatcaaa caggattttc gcctgctggg gcaaaccagc gtggaccgct 4080 
tgctgcaact ctctcagggc tctgtcgagt acaatatagg gcggcaattg gtggtagttt 4140 
gtcctaaaag cggacgaccc cgtttggtcg cacctggcga acgacgttga gagagtcccg 4200 
caggcggtga agggcaatca gctgttgccc gtctcactgg tgaaaagaaa aaccaccctg 4260 
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg gtccgccact tcccgttagt 4320 
cgacaacggg cagagtgacc acttttcttt ttggtgggac cgcgggttat gcgtttggcg 4380 
gagaggggcg cgcaaccggc attcattaat gcagctggca cgacaggttt cccgactgga 4440 
aagcgggcag tgagcgcaac gcaattaatg taagttagct cactcattag gcaccgggat 4500 
taagtaatta cgtcgaccgt gctgtccaaa gggctgacct ttcgcccgtc actcgcgttg 4560 
cgttaattac attcaatcga gtgagtaatc cgtggcccta ctcgaccgat gcccttgaga 4620 
gccttcaacc cagtcagctc cttccggtgg gcgcggggca tgactatcgt cgccgcactt 4680 
atgactgtct tctttatcat gagctggcta cgggaactct cggaagttgg gtcagtcgag 4740 
gaaggccacc cgcgccccgt actgatagca gcggcgtgaa tactgacaga agaaatagta 4800 
gcaactcgta ggacaggtgc cggcagcgct ctgggtcatt ttcggcgagg accgctttcg 4860 
ctggagcgcg acgatgatcg gcctgtcgct tgcggtattc cgttgagcat cctgtccacg 4920 
igccgtcgcga gacccagtaa aagccgctcc tggcgaaagc gacctcgcgc tgctactagc 4980 
cggacagcga acgccataag ggaatcttgc acgccctcgc tcaagccttc gtcactggtc 5040 
ccgccaccaa acgtttcggc gagaagcagg ccattatcgc cggcatggcg gccccacggg 5100 
ccttagaacg tgcgggagcg agttcggaag cagtgaccag ggcggtggtt tgcaaagccg 5160 
ctcttcgtcc ggtaatagcg gccgtaccgc cggggtgccc tgcgcatgat cgtgctcctg 5220 
tcgttgagga cccggctagg ctggcggggt tgccttactg gttagcagaa tgaatcaccg 5280 
atacgcgagc gaacgtgaag acgcgtacta gcacgaggac agcaactcct gggccgatcc 5340 
gaccgcccca acggaatgac caatcgtctt acttagtggc tatgcgctcg cttgcacttc 5400 
cgactgctgc tgcaaaacgt ctgcgacctg agcaacaaca tgaatggtct tcggtttccg 5460 
tgtttcgtaa agtctggaaa cgcggaagtc agcgccctgc gctgacgacg acgttttgca 5520 
gacgctggac tcgttgttgt acttaccaga agccaaaggc acaaagcatt tcagaccttt 5580 
gcgccttcag tcgcgggacg accattatgt tccggatctg catcgcagga tgctgctggc 5640 
taccctgtgg aacacctaca tctgtattaa cgaagcgctg gcattgaccc tgagtgattt 5700 
tggtaataca aggcctagac gtagcgtcct acgacgaccg atgggacacc fctgtggatgt 5760 
agacataatt gcttcgcgac cgtaactggg actcactaaa ttctctggtc ccgccgcatc 5820 
cataccgcca gttgtttacc ctcacaacgt tccagtaacc gggcatgttc atcatcagta 5880 
acccgtatcg tgagcatcct aagagaccag ggcggcgtag gtatggcggt caacaaatgg 5940 
gagtgttgca aggtcattgg cccgtacaag tagtagtcat tgggcatagc actcgtagga 6000 
ctctcgtttc atcggtatca ttacccccat gaacagaaat cccccttaca cggaggcatc 6060 
agtgaccaaa caggaaaaaa ccgcccttaa catggcccgc gagagcaaag tagccatagt 6120 
aatgggggta cttgtcttta gggggaatgt gcctccgtag tcactggttt gtcctttttt 6180 
ggcgggaatt gtaccgggcg tttatcagaa gccagacatt aacgcttctg gagaaactca 6240 
acgagctgga cgcggatgaa caggcagaca tctgtgaatc gcttcacgac cacgctgatg 6300 
aaatagtctt cggtctgtaa ttgcgaagac ctctttgagt tgctcgacct gcgcctactt 6360 
gtccgtctgt agacacttag cgaagtgctg gtgcgactac agctttaccg cagctgcctc 6420 
gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca 6480 
gcttgtctgt aagcggatgc tcgaaatggc gtcgacggag cgcgcaaagc cactactgcc 6540 
acttttggag' actgtgtacg tcgagggcct ctgccagtgt cgaacagaca ttcgcctacg 6600 
cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt ggcgggtgtc ggggcgcagc 6660 
catgacccag tcacgtagcg atagcggagt gtatactggc gccctcgtct gttcgggcag 6720 
tcccgcgcag tcgcccacaa ccgcccacag ccccgcgtcg gtactgggtc agtgcatcgc 6780 
tatcgcctca catatgaccg ttaactatgc ggcatcagag cagattgtac tgagagtgca 6840 
ccatatatgc ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc 6900 
aattgatacg ccgtagtctc gtctaacatg actctcacgt ggtatatacg ccacacttta 6960 
tggcgtgtct acgcattcct cttttatggc gtagtccgcg tcttccgctt cctcgctcac 7020 
tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 7080 
aatacggtta tccacagaat agaaggcgaa ggagcgagtg actgagcgac gcgagccagc 7140 
aagccgacgc cgctcgccat agtcgagtga gtttccgcca ttatgccaat aggtgtctta 7200 
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 7260 
aaaaggccgc gttgctggcg tttttccata ggctccgccc gtcccctatt gcgtcctttc 7320 
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ttgtacactc gttttccggt cgttttccgg tccttggcat ttttccggcg ca&cgaccgc 7380 
aaaaaggtat ccgaggcggg ccctgacgag catcacaaaa atcgacgctc aagtcagagg 7440 
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 7500 
gggactgctc gtagtgtttt tagctgcgag ttcagtctcc accgctttgg gctgtcctga 7560 
tatttctatg gtccgcaaag ggggaccttc gagggagcac cgctctcctg ttccgaccct 7620 
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 7680 
ctcacgctgt aggtatctca gcgagaggac aaggctggga cggcgaatgg cctatggaca 7740 
ggcggaaaga gggaagccct tcgcaccgcg aaagagtatc gagtgcgaca tccatagagt 7800 
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 7860 
accgctgcgc cttatccggt aactatcgtc ttgagtccaa caagccacat ccagcaagcg 7920 
aggttcgacc cgacacacgt gcttgggggg caagtcgggc tggcgacgcg gaataggcca 7980 
ttgatagcag aactcaggtt cccggtaaga cacgacttat cgccactggc agcagccact 8040 
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 8100 
gggccattct gtgctgaata gcggtgaccg tcgtcggtga ccattgtcct aatcgtctcg 8160 
ctccatacat ccgccacgat gtctcaagaa cttcaccacc cctaactacg gctacactag 8220 
aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 8280 
tagctcttga tccggcaaac ggattgatgc cgatgtgatc ttcctgtcat aaaccataga 8340 
cgcgag&cga cttcggtcaa tggaagcctt tttctcaacc atcgagaact aggccgtttg 8400 
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 8460 
aaggatctca agaagatcct ttgatctttt ctacggggtc tttggtggcg accatcgcca 8520 
ccaaaaaaac aaacgttcgt cgtctaatgc gcgtcttttt ttcctagagt tcttctagga 8580 
aactagaaaa gatgccccag tgacgctcag tggaacgaaa actcacgtta agggattttg 8640 
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 8700 
actgcgagtc accttgcttt tgagtgcaat tccctaaaac cagtactcta atagtttttc 8760 
ctagaagtgg atctaggaaa atttaatttt tacttcaaaa aaatcaatct aaagtatata 8820 
tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 8880 
ctgtctattt cgttcatcca tttagttaga tttcatatat actcatttga accagactgt 8940 
caatggttac gaattagtca ctccgtggat agagtcgcta gacagataaa gcaagtaggt 9000 
tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc 9060 
ccagtgctgc aatgataccg cgagacccac gctcaccggc atcaacggac tgaggggcag 9120 
cacatctatt gatgctatgc cctcccgaat ggtagaccgg ggtcacgacg ttactatggc 9180 
gctctgggtg cgagtggccg tccagattta tcagcaataa accagccagc cggaagggcc 9240 
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 9300 
aggtctaaat agtcgttatt tggtcggtcg gccttcccgg ctcgcgtctt caccaggacg 9360 
ttgaaatagg cggaggtagg tcagataatt aacaacggcc gaagctagag taagtagttc 9420 
gccagttaat agtttgcgca acgttgttgc cattgctgca ggcatcgtgg tgtcacgctc 9480 
gtcgtttggt atggcttcat cttcgatctc attcatcaag cggtcaatta tcaaacgcgt 9S40 
tgcaacaacg gtaacgacgt ccgtagcacc acagtgcgag cagcaaacca taccgaagta 9600 
tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 9660 
cggttagctc cttcggtcct ccgatcgttg tcagaagtaa agtcgaggcc aagggttgct 9720 
agttccgctc aatgtactag ggggtacaac acgttttttc gccaatcgag gaagccagga 9780 
ggctagcaac agtcttcatt gttggccgca gtgttatcac tcatggttat ggcagcactg 9840 
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 9900 
caaccggcgt cacaatagtg agtaccaata ccgtcgtgac gtattaagag aatgacagta 9960 
cggtaggcat tctacgaaaa gacactgacc actcatgagt accaagtcat tctgagaata 10020 
gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 10080 
tagcagaact ttaaaagtgc tggttcagta agactcttat cacatacgcc gctggctcaa 10140 
cgagaacggg ccgcagttat gccctattat ggcgcggtgt atcgtcttga aattttcacg 10200 
tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 10260 
ccagttcgat gtaacccact cgtgcaccca actgatcttc agtagtaacc ttttgcaaga 10320 
agccccgctt ttgagagttc ctagaatggc gacaactcta ggtcaagcta cattgggtga 10380 
gcacgtgggt tgactagaag agcatctttt actttcacca gcgtttctgg gtgagcaaaa 10440 
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 10500 
tcgtagaaaa tgaaagtggt cgcaaagacc cactcgtttt tgtccttccg ttttacggcg 10560 
ttttttccct tattcccgct gtgcctttac aacttatgag atactcttcc tttttcaata 10620 
ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 10680 
gaaaaataaa caaatagggg tatgagaagg aaaaagttat aataacttcg taaatagtcc 10740 
caataacaga gtactcgcct atgtataaac ttacataaat ctttttattt gtttatcccc 10800 
ttccgcgcac atttccccga aaagtgccac ctgaaattgt aaacgttaat attttgttaa 10860 
aattcgcgtt aaatttttgt taaatcagct cattttttaa aaggcgcgtg taaaggggct 10920 
tttcacggtg gactttaaca tttgcaatta taaaacaatt ttaagcgcaa tttaaaaaca 10980 
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atttagtcga 
gaatagaccg 
ggttatccgg 
ctcacaacaa 
agggcgaaaa 
ttttttgggg 
tcccgctacc 
gtaaagcact 
cggcgaacgt 
ggatttccct 
cttcccttct 
cgcgtaacca 
tcgcccgcga 
gcgcgaatta 



gtaaaaaatt 
agatagggtt 
ctttagccgt 
ggtcaaacct 
accgtctatc 
tcgaggtgcc 
gggtgatgca 
aaatcggaac 
ggcgagaaag 
cgggggctaa 
ttcgctttcc 
ccacacccgc 
tcccgcgacc 
cgcggcgatg 



ccaataggcc 
gagtgttgtt 
tttagggaat 
tgttctcagg 
agggcgatgg 
ttgcacctga 
cttggtagtg 
cctaaaggga 
gaagggaaga 
atctcgaact 
agcgggcgct 
cgcgcttaat 
gttcacatcg 
tcccgcgcag 



gaaatcggca 
ccagtttgga 
atttagtttt 
tgataatttc 
cccactacgt 
ggttgcagtt 
ggattagttc 
gcccccgatt 
aagcgaaagg 
gcccctttcg 
agggcgctgg 
gcgccgctac 
ccagtgcgac 
ggtaagcggt 



aaatccctta 
acaagagtcc 
cttatctggc 
aacgtggact 
gaaccatcac 
tcccgctttt 
aaaaaacccc 
tagagcttga 
catttcgtga 
gccgcttgca 
caagtgtagc 
agggcgcgtc 
gcgcattggt 



taaatcaaaa 
actattaaag 
tctatcccaa 
ccaacgtcaa 
cctaatcaag 
tggcagatag 
agctccacgg 
cggggaaagc 
tttagccttg 
ccgctctttc 
ggtcacgctg 
ccattcgcca 
ggtgtgggcg 



11040 
11100 
11160 
11220 
11280 
11340 
11400 
11460 
11520 
11580 
11640 
11700 
11760 
11800 



<210> 33 
<211> 2504 
<212> ADfl 

<213> Sequence artificielle 



<220> * ,. 

<223> Description de la sequence artificielle: 
d 1 expression pT7-7 



plasmide 



<400> 33 

aattctcatg 

ggatccccgg 

atttctagag 

tcagaagttc 

catgcagctc 

ccgtcagggc 

tagcgatagc 

gagtgcacca 

atgcgtaagg 

gcgctcggtc 

atccacagaa 

caggaaccgt 

gcatcacaaa 

ccaggcgttt 

cggatacctg 

taggtatctc 

cgttcagccc 

acacgactta 

aggcggtgct 

atttggtatc 

atccggcaaa 

gcgcagaaaa 

gtggaacgaa 

ctagatcctt 

aatgtcatga 

ggaaccccta 

taaccctgat 

cgtgtcgccc 

acgctggtga 

ctggatctca 

atgagcactt 

gagcaactcg 

acagaaaagc 

atgagtgata 

accgcttttt 



tttgacagct 

gcgcgaattc 

ggaaaccgtt 

gaatcgctgg 

ccggagacgg 

gcgtcagcgg 

ggagtgtata 

taggaagatc 

agaaaatacc 

gttcggctgc 

tcaggggata 

aaaaaggccg 

aatcgacgct 

ccccctggaa 

tccgcctttc 

agttcggtgt 

gaccgctgcg 

tcgccactgg 

acagagttct 

tgcgctctgc 

caaaccaccg 

aaaggatctc 

aactcacgtt 

ttaattcttg 

taataatggt 

tttgtttatt 

aaatgcttca 

ttattccctt 

aagtaaaaga 

acagcggtaa 

ttaaagttct 

gtcgccgcat 

atcttacgga 

acactgcggc 

tgcacaacat 



tatcatcgat 
tagccatatg 
gtggtctccc 
gcctcgcgcg 
tcacagcttg 
gtgttggcgg 
tactggctta 
ttccggaaga 
gcatcaggcg 
ggcgagcggt 
acgcaggaaa 
cgttgctggc 
caagtcagag 
gctccctcgt 
tcccttcggg 
aggtcgttcg 
ccttatccgg 
cagcagccac 
tgaagtggtg 
tgaagccagt 
ctggtagcgg 
aagaagatcc 
aagggatttt 
aagacgaaag 
ttcttagacg 
tttctaaata 
ataatattga 
ttttgcggca 
tgctgaagat 
gatccttgag 
gctatgtggc 
acactattct 
tggcatgaca 
caacttactt 

gggggatcat 



gataagcttg 
tatatctcct 
tatagtgagt 
tttcggtgat 
tctgtaagcg 
gtgtcggggc 
actatgcggc 
tcttcctatg 
ctcttccgct 
atcagctcac 
gaacatgtga 
gtttttccat 
gtggcgaaac 
gcgctctcct 
aagcgtggcg 
ctccaagctg 
taactatcgt 
tggtaacagg 
gcctaactac 
taccttcgga 
tggttttttt 
tttgatcttt 
ggtcatgaga 
ggcctcgtga 
tcaggtggca 
cattcaaata 
aaaaggaaga 
ttttgccttc 
cagttgggtg 
agttttcgcc 
gcggtattat 
cagaatgact 
gtaagagaat 
ctgacaacga 
gtaactcgcc 



ggctgcaggt 

tcttaaagtt 

cgtattaatt 

gacggtgaaa 

gatgccggga 

gcagccatga 

atcagagcag 

cggtgtgaaa 

tcctcgctca 

tcaaaggcgg 

gcaaaaggcc 

aggctccgcc 

ccgacaggac 

gttccgaccc 

ctttctcaat 

ggctgtgtgc 

cttgagtcca 

attagcagag 

ggctacacta 

aaaagagttg 

gtttgcaagc 

tctacggggt 

ttatcaaaaa 

tacgcctatt 

cttttcgggg 

tgtatccgct 

gtatgagtat 

ctgtttttgc 

cacgagtggg 

ccgaagaacg 

cccgtgttga 

tggttgagta 

tatgcagtgc 

tcggaggacc 

ttgatcgttg 



cgactctaga 

aaacaaaatt 

tcgaagtcta 

acctctgaca 

gcagacaagc 

cccagtcacg 

attgtactga 

taccgcacag 

ctgactcgct 

taatacggtt 

agcaaaaggc 

cccctgacga 

tataaagata 

tgccgcttac 

gctcacgctg 

acgaaccccc 

acccggtaag 

cgaggtatgt 

gaaggacagt 

gtagctcttg 

agcagattac 

ctgacgctca 

ggatcttcac 

tttataggtt 

aaatgtgcgc 

catgagacaa 

tcaacatttc 

tcacccagaa 

ttacatcgaa 

ttttccaatg 

cgccgggcaa 

ctcaccagtc 

tgccataacc 

gaaggagcta 

ggaaccggag 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 

2100 
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ctgaatgaag ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca 2160 

acgttgcgca aactattaac tggcgaacta cttactctag cttcccggca acaattaata 2220 

gactggatgg aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc 2280 

tggtttattg ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca 234 0 

ctggggccag atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca 2400 

actatggatg aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg 2460 

taactgtcag accaagttta ctcatatata ctttagattg attt 2504 



<210> 34 
<211> 813 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: systeme 
d' expression codant pour la prot§ine de fusion 
GST-DP-TME1 * * 

<400> 34 

atgtccccta tactaggtta ttggaaaatt aagggccttg tgcaacccac tcgacttctt^ 60 

ttggaatatc ttgaagaaaa atatgaagag catttgtatg agcgcgatga aggtgataaa 120 

tggcgaaaca aaaagtttga attgggtttg gagtttccca atcttcctta ttatattgat 180 

ggtgatgtta aattaacaca gtctatggcc atcatacgtt atatagctga caagcacaac 240 

atgttgggtg gttgtccaaa agagcgtgca gagatttcaa tgcttgaagg agcggttttg 300 

gatattagat acggtgtttc gagaattgca tatagtaaag actttgaaac tctcaaagtt 360 

gattttctta gcaagctacc tgaaatgctg aaaatgttcg aagatcgttt atgtcataaa 420 

acatatttaa atggtgatca tgtaacccat cctgacttca tgttgtatga cgctcttgat 480 

gttgttttat acatggaccc aatgtgcctg gatgcgttcc caaaattagt ttgttttaaa 540 

aaacgtattg aagctatccc acaaattgat aagtacttga aatccagcaa gtatatagca 600 

tggcctttgc agggctggca agccacgttt ggtggtggcg accatcctcc aaaatcggat 660 

ctgtctggtg gtggtggtgg tctggttccg cgtggatccg acccgatcgc tggtgctcac 720 

tggggtgttc tggctggtat cgcttacttc tctatggttg gtaactgggc taaagttctg 780 

gttgttctgc tgctgttcgc tggtgttgac get 813 



<210> 35 
<211> 513 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: systeme 
d 1 expression codant pour la prot€ine de fusion 
TrX-DP-TMEl 

<400> 35 

atgagegata aaattattca cctgactgac gacagttttg acaeggatgt actcaaagcg 60 
gaeggggega tcctcgtcga tttctgggca gagtggtgcg gtccgtgcaa aatgatcgee 120 
ccgattctgg atgaaatege tgacgaatat cagggcaaac tgaccgttgc aaaactgaac 180 
atcgatcaaa accctggcac tgcgccgaaa tatggcatcc gtggtatccc gaetctgetg 240 
ctgttcaaaa acggtgaagt ggcggcaacc aaagtgggtg cactgtctaa aggtcagttg 300 
aaagagttcc tegaegctaa cctggccggt tctggttctg gatctccaaa ateggatctg 360 
tctggtggtg gtggtggtct ggttccgcgt ggatccgacc egategctgg tgctcactgg 420 
ggtgttctgg ctggtatcgc ttacttctct atggttggta actgggctaa agttctggtt 480 
gttctgctgc tgttcgctgg tgttgacgct tag 513 



<210> 36 
<211> 117 
<212> ADN 
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<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: systdme 
d 1 expression codant pour la protSine de fusion 
M-DP-TMEl 

<400> 36 

atggacccga tcgctggtgc tcactggggt gttctggctg gtatcgctta cttctctatg 60 
rjpztggtaact gggctaaagt tctggttgtt ctgctgctgt tcgctggtgt tgacgct 117 



<210> 37 
<211> 795 
^212> ADN 

«ii3> Sequence artificielle 

'M7Q> 

i23> Description de la sequence artificielle: systdme 
d 1 expression codant pour la prot6ine de fusion 
GST-DP-TME2 



atgtccccta tactaggtta ttggaaaatt aagggccttg tgcaacccac tcgacttctt 60 
ttggaatatc ttgaagaaaa atatgaagag catttgtatg agcgcgatga aggtgataaa 120 
tggcgaaaca aaaagtttga attgggtttg gagtttccca atcttcctta ttatattgat 180 
ggtgatgtta aattaacaca gtctatggcc atcatacgtt atatagctga caagcacaac 240 
atgttgggtg gttgtccaaa agagcgtgca gagatttcaa tgcttgaagg agcggttttg 300 
gatattagat acggtgtttc gagaattgca tatagtaaag actttgaaac tctcaaagtt 360 
gattttctta gcaagctacc tgaaatgctg aaaatgttcg aagatcgttt atgtcataaa 420 
acatatttaa atggtgatca tgtaacccat cctgacttca tgttgtatga cgctcttgat 480 
gttgttttat acatggaccc aatgtgcctg gatgcgttcc caaaattagt ttgttttaaa 540 
aaacgtattg aagctatccc acaaattgat aagtacttga aatccagcaa gtatatagca 600 
tggcctttgc agggctggca agccacgttt ggtggtggcg accatcctcc aaaatcggat 660 
ctgtctggtg gtggtggtgg tctggttccg cgtggatccg acccggaata cgttgttctg 720 
ctgttcctgc tgctggctga cgctcgtgtt tgctcttgcc tgtggatgat gctgctgatc 780 
tctcaggctg aagct 795 



<210> 38 
<211> 486 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: systdme 
d 1 expression codant pour la prot^ine de fusion 
TrX-DP-TME2 



atgagcgata aaattattca cctgactgac gacagttttg acacggatgt actcaaagcg 60 
gacggggcga tcctcgtcga tttctgggca gagtggtgcg gtccgtgcaa aatgatcgcc 120 
ccgattctgg atgaaatcgc tgacgaatat cagggcaaac tgaccgttgc aaaactgaac 180 
atcgatcaaa accctggcac tgcgccgaaa tatggcatcc gtggtatccc gactctgctg 240 
ctgttcaaaa acggtgaagt ggcggcaacc aaagtgggtg cactgtctaa aggtcagttg 300 
aaagagttcc tcgacgctaa cctggccggt tctggttctg gatctgatct gtctggtggt 360 
ggtggtggtc tggttccgcg tggatccgac ccggaatacg ttgttctgct gttcctgctg 420 
ctggctgacg ctcgtgtttg ctcttgcctg tggatgatgc tgctgatctc tcaggctgaa 480 
gcttag 486 



*400> 37 



<400> 38 
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<210> 39 
<211> 99 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: systeme 
d' expression codant pour la protiine de fusion 
M-DP-TME2 

<400> 39 

atggacccgg aatacgttgt tctgctgttc ctgctgctgg ctgacgctcg tgtttgctct 60 
tgcctgtgga tgatgctgct gatctctcag gctgaagct 99 

<210> 40 
<211> 5082 
<212> ADM 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: vecteur 
d'expression pGEXKT-dp-Pt (TME1) 

<400> 40 

acgttatcga ctgcacggtg caccaatgct tctggcgtca ggcagccatc ggaagctgtg 60 
gtatggctgt gcaggtcgta aatcactgca taattcgtgt cgctcaaggc gcactcccgt 120 
tctggataat gttttttgcg ccgacatcat aacggttctg gcaaatattc tgaaatgagc 180 
tgttgacaat taatcatcgg ctcgtataat gtgtggaatt gtgagcggat aacaatttca 240 
cacaggaaac agtattcatg tcccctatac taggttattg gaaaattaag ggccttgtgc 300 
aacccactcg acttcttttg gaatatcttg aagaaaaata tgaagagcat ttgtatgagc 360 
gcgatgaagg tgataaatgg cgaaacaaaa agtttgaatt gggtttggag tttcccaatc 420 
ttccttatta tattgatggt gatgttaaat taacacagtc tatggccatc atacgttata 480 
tagctgacaa gcacaacatg ttgggtggtt gtccaaaaga gcgtgcagag atttcaatgc 540 
ttgaaggagc ggttttggat attagatacg gtgtttcgag aattgcatat agtaaagact 600 
ttgaaactct caaagttgat tttcttagca agctacctga aatgctgaaa atgttcgaag 660 
atcgtttatg tcataaaaca tatttaaatg gtgatcatgt aacccatcct gacttcatgt 720 
tgtatgacgc tcttgatgtt gttttataca tggacccaat gtgcctggat gcgttcccaa 780 
aattagtttg ttttaaaaaa cgtattgaag ctatcccaca aattgataag tacttgaaat 840 
ccagcaagta tatagcatgg cctttgcagg gctggcaagc cacgtttggt ggtggcgacc 900 
atcctccaaa atcggatctg tctggtggtg gtggtggtct ggttccgcgt ggatccgacc 960 
cgatcgctgg tgctcactgg ggtgttctgg ctggtatcgc ttacttctct atggttggta 1020 
actgggctaa agttctggtt gttctgctgc tgttcgctgg tgttgacgct taggaattca 1080 
tcgtgactga ctgacgatct gcctcgcgcg tttcggtgat gacggtgaaa acctctgaca 1140 
catgcagctc ccggagacgg tcacagcttg tctgtaagcg gatgccggga gcagacaagc 1200 
ccgtcagggc gcgtcagcgg gtgttggcgg gtgtcggggc gcagccatga cccagtcacg 1260 
tagcgatagc ggagtgtata attcttgaag acgaaagggc ctcgtgatac gcctattttt 1320 
ataggttaat gtcatgataa taatggtttc ttagacgtca ggtggcactt ttcggggaaa 1380 
tgtgcgcgga acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat 144 0 
gagacaataa ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca 1500 
acatttccgt gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca 1560 
cccagaaacg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta 162 0 
catcgaactg gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt 1680 
tccaatgatg agcactttta aagttctgct atgtggcgcg gtattatccc gtgttgacgc 1740 
cgggcaagag caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc 1800 
accagtcaca gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc 1860 
cataaccatg agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa 192 0 
ggagctaacc gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga 1980 
accggagctg aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgcagcaat 2040 
ggcaacaacg ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca 2100 
attaatagac tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc 2160 
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ggctggctgg tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat 2220 
tgcagcactg gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag 2280 
tcaggcaact atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa 2340 
gcattggtaa ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca 2400 
tttttaattt aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc 2460 
ttaacgtgag ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc 2520 
ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 2580 
agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 2640 
cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt 2700 
caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 2760 
tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 2820 
ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 2880 
ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 2940 
gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 3000 
gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 3060 
tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa 3120 
cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc 3180 
gttatcccct gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg 3240 
ccgcagccga acgaccgajgc gcagegagtc agtgagcgag gaagcggaag agcgcctgat 3300 
gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcataaatt ccgacaccat 3360 
cgaatggtgc aaaacctttc gcggtatggc atgatagcgc ccggaagaga gtcaattcag 3420 
ggtggtgaat gtgaaaccag taacgttata cgatgtcgca gagtatgccg gtgtctctta 3480 
tcagaccgtt tcccgcgtgg tgaaccacfgc cagccacgtt tctgcgaaaa cgcgggaaaa 3540 
agtggaagcg gcgatggcgg agctgaatta cattcccaac cgcgtggcac aacaactggc 3600 
gggcaaacag tcgttgctga ttggcgttgc cacctccagt ctggccctgc acgcgccgtc 3660 
gcaaattgtc gcggcgatta aatctcgcgc cgatcaactg ggtgccagcg tggtggtgtc 3720 
gatggtagaa cgaagcggcg tcgaagcctg taaagcggcg gtgcacaatc ttctcgcgca 3780 
acgcgtcagt gggctgatca ttaactatcc gctggatgac caggatgcca ttgctgtgga 3840 
agctgcctgc actaatgttc cggcgttatt tcttgatgtc tctgaccaga cacccatcaa 3900 
cagtattatt ttctcccatg aagacggtac gcgactgggc gtggagcatc tggtcgcatt 3960 
gggtcaccag caaatcgcgc tgttagcggg cccattaagt tctgtctcgg cgcgtctgcg 4020 
tctggctggc tggcataaat atctcactcg caatcaaatt cagccgatag cggaacggga 4080 
aggcgactgg agtgccatgt ccggttttca acaaaccatg caaatgctga atgagggcat 4140 
cgttcccact gcgatgctgg ttgccaacga tcagatggcg ctgggcgcaa tgcgcgccat 4200 
taccgagtcc gggctgcgcg ttggtgcgga tafcctcggta gtgggatacg acgataccga 4260 
agacagctca tgttatatcc cgccgttaac caccatcaaa caggattttc gcctgctggg 4320 
gcaaaccagc gtggaccgct tgctgcaact ctctcagggc caggcggtga agggcaatca 43 80 
gctgttgccc gtctcactgg tgaaaagaaa aaccaccctg gcgcccaata cgcaaaccgc 4440 
ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt cccgactgga 4500 
aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag gcaccccagg 4560 
ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc 4620 
acacaggaaa cagctatgac catgattacg gattcactgg ccgtcgtttt acaacgtcgt 4680 
gactgggaaa accctggcgt tacccaactt aatcgccttg cagcacatcc ccctttcgcc 4740 
agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg 4800 
aatggcgaat ggcgctttgc ctggtttccg gcaccagaag cggtgccgga aagctggctg 4860 
gagtgcgatc ttcctgaggc cgatactgtc gtcgtcccct caaactggca gatgcacggt 492 0 
tacgatgcgc ccatctacac caacgtaacc tatcccatta cggtcaatcc gccgtttgtt 4980 
cccacggaga atccgacggg ttgttactcg ctcacattta atgttgatga aagctggcta 5040 
caggaaggcc agacgcgaat tatttttgat ggcgttggaa tt 5082 



<210> 41 
<211> 5064 
<212> ADN 

<213> Sequence artificielle 



<220> 

<223> Description de la sequence artificielle: vecteur 
d" expression pGEXKT-dp-Pt (TME2 ) 



<400> 41 
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acgttatcga ctgcacggtg caccaatgct tctggcgtca ggcagccatc ggaagctgtg 60 
gtatggctgt gcaggtcgta aatcactgca taattcgtgt cgctcaaggc gcactcccgt 120 
tctggataat gttttttgcg ccgacatcat aacggttctg gcaaatattc tgaaatgagc 180 
tgttgacaat taatcatcgg ctcgtataat gtgtggaatt gtgagcggat aacaatttca 240 
cacaggaaac agtattcatg tcccctatac taggttattg gaaaattaag ggccttgtgc 300 
aacccactcg acttcttttg gaatatcttg aagaaaaata tgaagagcat ttgtatgagc 360 
gcgatgaagg tgataaatgg cgaaacaaaa agtttgaatt gggtttggag tttcccaatc 42 0 
ttccttatta tattgatggt gatgttaaat taacacagtc tatggccatc atacgttata 480 
tagctgacaa gcacaacatg ttgggtggtt gtccaaaaga gcgtgcagag atttcaatgc 540 
ttgaaggagc ggttttggat attagatacg gtgtttcgag aattgcatat agtaaagact 600 
ttgaaactct caaagttgat tttcttagca agctacctga aatgctgaaa atgttcgaag 660 
atcgtttatg tcataaaaca tatttaaatg gtgatcatgt aacccatcct gacttcatgt 720 
tgtatgacgc tcttgatgtt gttttataca tggacccaat gtgcctggat gcgttcccaa 780 
aattagtttg ttttaaaaaa cgtattgaag ctatcccaca aattgataag tacttgaaat 840 
ccagcaagta tatagcatgg cctttgcagg gctggcaagc cacgtttggt ggtggcgacc 900 
atcctccaaa atcggatctg tctggtggtg gtggtggtct ggttccgcgt ggatccgacc 960 
cggaatacgt tgttctgctg ttcctgctgc tggctgacgc tcgtgtttgc tcttgcctgt 1020 
ggatgatgct gctgatctct caggctgaag cttaggaatt catcgtgact gactgacgat 1080 
ctgcctcgcg cgtttcggtg atgacggtga aaacctctga cacatgcagc tcccggagac 1140 
ggtcacagct tgtctgtaag cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc 12 00 
gggtgttggc gggtgtcggg gcgcagccat gacccagtca cgtagcgata gcggagtgta 1260 
taattcttga agacgaaagg gcctcgtgat . acgcctattt ttataggtta atgtcatgat 1320 
aataatggtt tcttagacgt caggtggcac ttttcgggga aatgtgcgcg gaacccctat 13*8 0 
ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat aaccctgata 144 0 
aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc gtgtcgccct 1500 * 
tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa cgctggtgaa 1560 
agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac tggatctcaa 1620 
cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga tgagcacttt 1680 
taaagttctg ctatgtggcg cggtattatc ccgtgttgac gccgggcaag agcaactcgg 1740 
tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca cagaaaagca 1800 
tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca tgagtgataa 1860 
cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa ccgctttttt 1920 
gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc tgaatgaagc 1980 
cataccaaac gacgagcgtg acaccacgat gcctgcagca atggcaacaa cgttgcgcaa 2040 
actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag actggatgga 2100 
ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct ggtttattgc 2160 
tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac tggggccaga 2220 
tggtaagccc tcccgtatcg tagttatcta. cacgacgggg agtcaggcaa ctatggatga 2280 
acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt aactgtcaga 2340 
ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat ttaaaaggat 2400 
ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg agttttcgtt 2460 
ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc ctttttttct 2520 
gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc 2580 
ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag cgcagatacc 2640 
aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact ctgtagcacc 2700 
gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg gcgataagtc 2760 
gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc ggtcgggctg 282 0 
aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg aactgagata 2880 
cctacagcgt gagctatgag aaagcgccac gcttcccgaa gggagaaagg cggacaggta 2940 
tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc 3000 
ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc gatttttgtg 3060 
at get eg tea ggggggcgga gcctatggaa aaacgccagc aacgcggcct ttttacggtt 3120 
cctggccttt tgctggcctt ttgetcacat gttctttcct gcgttatccc ctgattctgt 3180 
ggataaccgt attaccgcct ttgagtgagc tgataccget cgccgcagcc gaacgaccga 3240 
gegcagegag tcagtgagcg aggaagegga agagegectg atgeggtatt ttctccttac 3300 
gcatctgtgc ggtatttcac acegcataaa ttccgacacc atcgaatggt gcaaaacctt 3360 
tegeggtatg gcatgatagc geceggaaga gagtcaattc agggtggtga atgtgaaacc 3420 
agtaacgtta tacgatgtcg cagagtatgc cggtgtctct tatcagaccg tttcccgcgt 3480 
ggtgaaccag gccagccacg tttctgcgaa aacgegggaa aaagtggaag eggegatgge 3540 
ggagctgaat tacattccca accgcgtggc acaacaactg gegggcaaac agtcgttgct 3600 
gattggcgtt gccacctcca gtctggccct gcacgcgccg tegcaaattg tegeggegat 3660 
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taaatctcgc gccgatcaac tgggtgccag cgtggtggtg tcgatggtag aacgaagcgg 3720 
cgtcgaagcc tgtaaagcgg cggtgcacaa tcttctcgcg caacgcgtca gtgggctgat 3780 
cattaactat ccgctggatg accaggatgc cattgctgtg gaagctgcct gcactaatgt 3840 
tccggcgtta tttcttgatg tctctgacca gacacccatc aacagtatta ttttctccca 3900 
tgaagacggt acgcgactgg gcgtggagca tctggtcgca ttgggtcacc agcaaatcgc 3960 
gctgttagcg ggcccattaa gttctgtctc ggcgcgtctg cgtctggctg gctggcataa 4020 
atatctcact cgcaatcaaa ttcagccgat agcggaacgg gaaggcgact ggagtgccat 4080 
gtccggtttt caacaaacca tgcaaatgct gaatgagggc atcgttccca ctgcgatgct 4140 
ggttgccaac gatcagatgg cgctgggcgc aatgcgcgcc attaccgagt ccgggctgcg 4200 
cgttggtgcg gatatctcgg tagtgggata cgacgatacc gaagacagct catgttatat 4260 
cccgccgtta accaccatca aacaggattt tcgcctgctg gggcaaacca gcgtggaccg 4320 
cttgctgcaa ctctctcagg gccaggcggt gaagggcaat cagctgttgc ccgtctcact 4380 
ggtgaaaaga aaaaccaccc tggcgcccaa tacgcaaacc gcctctcccc gcgcgttggc 4440 
cgattcatta atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca 4500 
acgcaattaa tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc 4560 
cggctcgtat gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg 4620 
accatgatta cggattoact ggccgtcgtt ttacaacgtc gtgactggga aaaccctggc 4680 
gttacccaac ttaatcgrcct tgcagcacat ccccctttcg ccagctggcg taatagcgaa -4740 
gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc tgaatggcga atg^cgcttt 4800 
gcctggtttc cggcaccaga agcggtgccg gaaa^ctggc tggagtgcga tcttcctgag 4860 
gccgatactg tcgtcgtccc ctcaaactgg cagatgcacg_gttacgatgc gcccatctac 4920 
accaacgtaa cctatcccat tacggtcaat ccgccgtttg^ttcccacgga gaatccgacg 498CT 
ggttgt'tact cgctcacatt taatgttgat gaaagctggc t'acaggaagg ccagacgcga 5040 
attatttttg atggcgttgg aatt 5064 



<210> 42 
<211> 5918 
<212> ADN 

<213> S§C[uence artificielle 
<220> 

<223> Description de la sequence artificielle: vecteur 
d^xpression pET32a-dp-Pt (TME1) 

<400> 42 

atccggatat agttcctcct ttcagcaaaa aacccctcaa gacccgttta gaggccccaa 60 
ggggttatgc tagttattgc tcagcggtgg cagcagccaa ctcagcttcc tttcgggctt 120 
tgttagcagc cggatctcag tggtggtggt ggtggtgctc gagtgcggcc gcaagcttgt 180 
cgacggagct cgaattccta agcgtcaaca ccagcgaaca gcagcagaac aaccagaact 240 
ttagcccagt taccaaccat agagaagtaa gcgataccag ccagaacacc ccagtgagca 300 
ccagcgatcg ggtcggatcc acgcggaacc agaccaccac caccaccaga cagatccgat 360 
tttggagatc cagaaccaga accggccagg ttagcgtcga ggaactcttt caactgacct 420 
ttagacagtg cacccacttt ggttgccgcc acttcaccgt ttttgaacag cagcagagtc 480 
gggataccac ggatgccata tttcggcgca gtgccagggt tttgatcgat gttcagtttt 540 
gcaacggtca gtttgccctg atattcgtca gcgatttcat ccagaatcgg ggcgatcatt 600 
ttgcacggac cgcaccactc tgcccagaaa tcgacgagga tcgccccgtc cgctttgagt 660 
acatccgtgt caaaactgtc gtcagtcagg tgaataattt tatcgctcat atgtatatct 720 
ccttcttaaa gttaaacaaa attatttcta gaggggaatt gttatccgct cacaattccc 780 
ctatagtgag tcgtattaat ttcgcgggat cgagatcgat ctcgatcctc tacgccggac 840 
gcatcgtggc cggcatcacc ggcgccacag gtgcggttgc tggcgcctat atcgccgaca 900 
tcaccgatgg ggaagatcgg gctcgccact tcgggctcat gagcgcttgt ttcggcgtgg 960 
gtatggtggc aggccccgtg gccgggggac tgttgggcgc catctccttg catgcaccat 1020 
tccttgcggc ggcggtgctc aacggcctca acctactact gggctgcttc ctaatgcagg 1080 
agtcgcataa gggagagcgt cgagatcccg gacaccatcg aatggcgcaa aacctttcgc 1140 
ggtatggcat gatagcgccc ggaagagagt caattcaggg tggtgaatgt gaaaccagta 1200 
acgttatacg atgtcgcaga gtatgccggt gtctcttatc agaccgtttc ccgcgtggtg 1260 
aaccaggcca gccacgtttc tgcgaaaacg cgggaaaaag tggaagcggc gatggcggag 1320 
ctgaattaca ttcccaaccg cgtggcacaa caactggcgg gcaaacagtc gttgctgatt 1380 
ggcgttgcca cctccagtct ggccctgcac gcgccgtcgc aaattgtcgc ggcgattaaa 1440 
tctcgcgccg atcaactggg tgccagcgtg gtggtgtcga tggtagaacg aagcggcgtc 1500 
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gaagcctgta aagcggcggt gcacaatctt ctcgcgcaac gcgtcagtgg gctgatcatt 1560 
aactatccgc tggatgacca ggatgccatt gctgtggaag ctgcctgcac taatgttccg 162 0 
gcgttatttc ttgatgtctc tgaccagaca cccatcaaca gtattatttt ctcccatgaa 168 0 
gacggtacgc gactgggcgt ggagcatctg gtcgcattgg gtcaccagca aatcgcgctg 1740 
ttagcgggcc cattaagttc tgtctcggcg cgtctgcgtc tggctggctg gcataaatat 1800 
ctcactcgca atcaaattca gccgatagcg gaacgggaag gcgactggag tgccatgtcc 1860 
ggttttcaac aaaccatgca aatgctgaat gagggcatcg ttcccactgc gatgctggtt 1920 
gccaacgatc agatggcgct gggcgcaatg cgcgccatta ccgagtccgg gctgcgcgtt 1980 
ggtgcggaca tctcggtagt gggatacgac gataccgaag acagctcatg ttatatcccg 2040 
ccgttaacca ccatcaaaca ggattttcgc ctgctggggc aaaccagcgt ggaccgcttg 2100 
ctgcaactct ctcagggcca ggcggtgaag ggcaatcagc tgttgcccgt ctcactggtg 2160 
aaaagaaaaa ccaccctggc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 2220 
tcattaatgc agctggcacg acaggtttcc cgactggaaa gcgggcagtg agcgcaacgc 2280 
aattaatgta agttagctca ctcattaggc accgggatct cgaccgatgc ccttgagagc 2340 
cttcaaccca gtcagctcct tccggtgggc gcggggcatg actatcgtcg ccgcacttat 2400 
gactgtcttc tttatcatgc aactcgtagg acaggtgccg gcagcgctct gggtcatttfc 2460 
cggcgaggac cgctttcgct ggagcgcgac gatgatcggc ctgtcgcttg cggtattcgg 2520 
aatcttgcac gccctcgctc aagccttcgt cactggtccc gccaccaaac gttfccggcga 2580 
gaagcaggcc attatcgccg gcatggcggc cccacgggtg cgcatgatcg tgctcctgtc 2640 
gttgaggacc cggctaggct ggcggggttg ccttactggt tagcagaatg aatcaccgat 2700 
acgcgagcga acgtgaagcg actgctgctg caaaacgtct gcgacctgag caacaacatg 2760 
aatggtcttc ggtttccgtg tttcgtaaag tctggaaacg' cggaagtcag cgccctgcac 2820 
cattatgttc cggatctgca tcgcaggatg ctgctggcta ccctgtggaa cacctacatc 2880 
tgtattaacg aagcgctggc attgaccctg agtgattttt ctctggtccc gccgcatcca 2940 
taccgccagt tgtttaccct cacaacgttc cdgftaSccgg gcatgttcat catcagtaac 3000 
ccgtatcgtg agcatcctct ctcgtttcat cggtatcatt acccccatga acagaaatcc 3060 
cccttacacg gaggcatcag tgaccaaaca ggaaaaaacc gcccttaaca tggcccgctt 3120 
tatcagaagc cagacattaa cgcttctgga gaaactcaac gagctggacg cggatgaaca 3180 
ggcagacatc tgtgaatcgc ttcacgacca cgctgatgag ctttaccgca gctgcctcgc 3240 
gcgtttcggt gatgacggtg aaaacctctg acacatgcag ctcccggaga cggtcacagc 3300 
ttgtctgtaa gcggatgccg ggagcagaca agcccgtcag ggcgcgtcag cgggtgttgg 3360 
cgggtgtcgg ggcgcagcca tgacccagtc acgtagcgat agcggagtgt atactggctt 3420 
aactatgcgg catcagagca gattgtactg agagtgcacc atatatgcgg tgtgaaatac 3480 
cgcacagatg cgtaaggaga aaataccgca tcaggcgctc ttccgcttcc tcgctcactg 3540 
actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa 3600 
tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc 3660 
aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc 3720 
ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat 3780 
aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc 3840 
cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct 3900 
cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg 3960 
aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc 4020 
cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga 4080 
ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa 4140 
ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta 42 00 
gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc 42 60 
agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg 4320 
acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga 43 80 
tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg 4440 
agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct 4500 
gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg 4560 
agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc 4620 
cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa 4680 
ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc 4740 
cagttaatag tttgcgcaac gttgttgcca ttgctgcagg catcgtggtg tcacgctcgt 4 800 
cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc 4860 
ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt 4920 
tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc 4980 
catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt 5040 
gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc gcgccacata 5100 
gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga 5160 
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tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag 5220 
catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa 5280 
aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt 5340 
attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga 5400 
aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct gaaattgtaa 5460 
acgttaatat tttgttaaaa ttcgcgttaa atttttgtta aatcagctca ttttttaacc 5520 
aataggccga aatcggcaaa atcccttata aatcaaaaga atagaccgag atagggttga 5580 
gtgttgttcc agtttggaac aagagtccac tattaaagaa cgtggactcc aacgtcaaag 5640 
ggcgaaaaac cgtctatcag ggcgatggcc cactacgtga accatcaccc taatcaagtt 5700 
-itggggtc gaggtgccgt aaagcactaa atcggaaccc taaagggagc ccccgattta 5760 
£:*£cttgacg gggaaagccg gcgaacgtgg cgagaaagga agggaagaaa gcgaaaggag 5820 
egggcgctag ggcgctggca agtgtagcgg tcacgctgcg cgtaaccacc acacccgccg 5880 
cgcttaatgc gccgctacag ggcgcgtccc attcgcca 5918 

. 4lO> 43 
*«X1> 5891 
^ia> ADN 

**3> Sequence artificielle 
<720> 

*223> Description de la sequence artificielle: vecteur 
d r expression pET32a-dp-Pt (TME2) 

<400> 43 

atccggatat agttcctcct ttcagcaaaa aacccctcaa gacccgttta gaggccccaa 60 
ggggttatgc tagttattgc tcagcggtgg cagcagccaa ctcagcttcc tttcgggctt 120 
tgttagcagc cggatctcag tggtggtggt ggtggtgctc gagtgcggcc gcaagcttgt 180 
cgacggagct cgaattccta agcttcagcc tgagagatca gcagcatcat ccacaggcaa 240 
gagcaaacac gagcgtcagc cagcagcagg aacagcagaa caacgtattc cgggtcggat 300 
ccacgcggaa ccagaccacc accaccacca gacagatcag atccagaacc agaaccggcc 360 
aggttagcgt cgaggaactc tttcaactga cctttagaca gtgcacccac tttggttgcc 420 
gccacttcac cgtttttgaa cagcagcaga gtcgggatac cacggatgcc atatttcggc 480 
gcagtgccag ggttttgatc gatgttcagt tttgcaacgg tcagtttgcc ctgatattcg 540 
tcagcgattt catccagaat cggggcgatc attttgcacg gaccgcacca ctctgcccag 600 
aaatcgacga ggatcgcccc gtccgctttg agtacatccg tgtcaaaact gtcgtcagtc 660 
aggtgaataa ttttatcgct catatgtata tctccttctt aaagttaaac aaaattattt 720 
ctagagggga attgttatcc gctcacaatt cccctatagt gagtcgtatt aatttcgcgg 780 
gatcgagatc gatctcgatc ctctacgccg gacgcatcgt ggccggcatc accggcgcca 840 
caggtgcggt tgctggcgcc tatatcgccg acatcaccga tggggaagat cgggctcgcc 900 
acttcgggct catgagcgct tgtttcggcg tgggtatggt ggcaggcccc gtggccgggg 960 
gactgttggg cgccatctcc ttgcatgcac cattccttgc ggcggcggtg ctcaacggcc 1020 
tcaacctact actgggctgc ttcctaatgc aggagtcgca taagggagag cgtcgagatc 1080 
ccggacacca tcgaatggcg caaaaccttt cgcggtatgg catgatagcg cccggaagag 1140 
agtcaattca gggtggtgaa tgtgaaacca gtaacgttat acgatgtcgc agagtatgcc 1200 
ggtgtctctt atcagaccgt ttcccgcgtg gtgaaccagg ccagccacgt ttctgcgaaa 1260 
acgcgggaaa aagtggaagc ggcgatggcg gagctgaatt acattcccaa ccgcgtggca 1320. 
caacaactgg cgggcaaaca gtcgttgctg attggcgttg ccacctccag tctggccctg 1380 
cacgcgccgt cgcaaattgt cgcggcgatt aaatctcgcg ccgatcaact gggtgccagc 1440 
gtggtggtgt cgatggtaga acgaagcggc gtcgaagcct gtaaagcggc ggtgcacaat 1500 
cttctcgcgc aacgcgtcag tgggctgatc attaactatc cgctggatga ccaggatgcc 1560 
attgctgtgg aagctgcctg cactaatgtt ccggcgttat ttcttgatgt ctctgaccag 1620 
acacccatca acagtattat tttctcccat gaagacggta cgcgactggg cgtggagcat 1680 
ctggtcgcat tgggtcacca gcaaatcgcg ctgttagcgg gcccattaag ttctgtctcg 1740 
gcgcgtctgc gtctggctgg ctggcataaa tatctcactc gcaatcaaat tcagccgata 1800 
gcggaacggg aaggcgactg gagtgccatg tccggttttc aacaaaccat gcaaatgctg 1860 
aatgagggca tcgttcccac tgcgatgctg gttgccaacg atcagatggc gctgggcgca 1920 
atgcgcgcca ttaccgagtc cgggctgcgc gttggtgcgg acatctcggt agtgggatac 1980 
gacgataccg aagacagctc atgttatatc ccgccgttaa ccaccatcaa acaggatttt 2040 
cgcctgctgg ggcaaaccag cgtggaccgc ttgctgcaac tctctcaggg ccaggcggtg 2100 
aagggcaatc agctgttgcc cgtctcactg gtgaaaagaa aaaccaccct ggcgcccaat 2160 
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acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc acgacaggtt 2220 
tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtaagttagc tcactcatta 2280 
ggcaccggga tctcgaccga tgcccttgag agccttcaac ccagtcagct ccttccggtg 2340 
ggcgcggggc atgactatcg tcgccgcact tatgactgtc ttctttatca tgcaactcgt 2400 
aggacaggtg ccggcagcgc tctgggtcat tttcggcgag gaccgctttc gctggagcgc 2460 
gacgatgatc ggcctgtcgc ttgcggtatt cggaatcttg cacgccctcg ctcaagcctt 2520 
cgtcactggt cccgccacca aacgtttcgg cgagaagcag gccattatcg ccggcatggc 2580 
ggccccacgg gtgcgcatga tcgtgctcct gtcgttgagg acccggctag gctggcgggg 2640 
ttgccttact ggttagcaga atgaatcacc gatacgcgag cgaacgtgaa gcgactgctg 2700 
ctgcaaaacg tctgcgacct gagcaacaac atgaatggtc ttcggtttcc gtgtttcgta 2760 
aagtctggaa acgcggaagt cagcgccctg caccattatg ttccggatct gcatcgcagg 2820 
atgctgctgg ctaccctgtg gaacacctac atctgtatta acgaagcgct ggcattgacc 2880 
ctgagtgatt tttctctggt cccgccgcat ccataccgcc agttgtttac cctcacaacg 2940 
ttccagtaac cgggcatgtt catcatcagt aacccgtatc gtgagcatcc tctctcgttt 3000 
catcggtatc attaccccca tgaacagaaa tcccccttac acggaggcat cagtgaccaa 3060 
acaggaaaaa accgccctta acatggcccg ctttatcaga agccagacat taacgcttct 3120 
ggagaaactc ^aacgagctgg acgcggatga acaggcagac atctgtgaat cgcttcacga 3X80 
ccacgctgat *gagctttacc gcagctgcct cgcgcgtttc ggtgatgacg gtgaaaacct 3240 
ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg ccgggagcag 3300 
acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggcgcag ccatgaccca 3360 
gtcacgtagc gatagcggag tgtatactgg cttaactatg cggcatcaga gcagattgta 3420 
ctgagagtgc accatatatg cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc 3480 
gcatcaggcg'ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc 3540 
ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 3600 
acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 3660 
cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 3720 
caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 3780 
gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 3840 
tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt 3900 
aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 3960 
ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 4020 
cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 4080 
tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc 4140 
tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 42 00 
ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 4260 
aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 4320 
aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa 4380 
aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat 4440 
gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct 4500 
gactccccgt cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg 4560 
caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag 4620 
ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta 4680 
attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg 4740 
ccattgctgc aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg .4800 
gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct 48 60 
ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta 4920 
tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg 4980 
gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc 5040 
cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg 5100 
gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga 5160 
tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg 5220 
ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat 5280 
gttgaatact catactcttc ctttttcaat attattgaag catttatcag ggttattgtc 5340 
tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca 5400 
catttccccg aaaagtgcca cctgaaattg taaacgttaa tattttgtta aaattcgcgt 5460 
taaatttttg ttaaatcagc tcatttttta accaataggc cgaaatcggc aaaatccctt 5520 
ataaatcaaa agaatagacc gagatagggt tgagtgttgt tccagtttgg aacaagagtc 5580 
cactattaaa gaacgtggac tccaacgtca aagggcgaaa aaccgtctat cagggcgatg 5640 
gcccactacg tgaaccatca ccctaatcaa gttttttggg gtcgaggtgc cgtaaagcac 5700 
taaatcggaa ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg 5760 
tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc tagggcgctg gcaagtgtag 5820 
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cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt 5880 
cccattcgcc a 5891 



<210> 44 
<211> 2617 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 
d» expression pT7-7-dp-Pt (TME1) 



vecteur 



<400> 44 

aattctcatg 

ggatccccgg 

actttagccc 

gcaccagcga 

gagggaaacc 

ttcgaatcgc 

ctcccggaga 

ggcgcgtcag 

agcggagtgt 

ccataggaag 

aggagaaaat 

gtcgttcggc 

gaatcagggg 

cgtaaaaagg 

aaaaatcgac 

tttccccctg 

ctgtccgcct 

ctcagttcgg 

cccgaccgct 

ttatcgccac 

gctacagagt 

atctgcgctc 

aaacaaacca 

aaaaaaggat 

gaaaactcac 

cttttaattc 

tgataataat 

ctatttgttt 

gataaatgct 

cccttattcc 

tgaaagtaaa 

tcaacagcgg 

cttttaaagt 

tcggtcgccg 

agcatcttac 

ataacactgc 

ttttgcacaa 

aagccatacc 

gcaaactatt 

tggaggcgga 

ttgctgataa 

cagatggtaa 

atgaacgaaa 

cagaccaagt 



tttgacagct 
gcgcgaattc 
agttaccaac 
tcgggtccat 
gttgtggtct 
tgggcctcgc 
cggtcacagc 
cgggtgttgg 
atatactggc 
atcttccgga 
accgcatcag 
tgcggcgagc 
ataacgcagg 
ccgcgttgct 
gctcaagtca 
gaagctccct 
ttctcccttc 
tgtaggtcgt 
gcgccttatc 
tggcagcagc 
tcttgaagtg 
tgctgaagcc 
ccgctggtag 
ctcaagaaga 
gttaagggat 
ttgaagacga 
ggtttcttag 
atttttctaa 
tcaataatat 
cttttttgcg 
agatgctgaa 
taagatcctt 
tctgctatgt 
catacactat 
ggatggcatg 
ggccaactta 
catgggggat 
aaacgacgag 
aactggcgaa 
taaagttgca 
atctggagcc 
gccctcccgt 
tagacagatc 
ttactcatat 



tatcatcgat 
ctaagcgtca 
catagagaag 
atgtatatct 
ccctatagtg 
gcgtttcggt 
ttgtctgtaa 
cgggtgtcgg 
ttaactatgc 
agatcttcct 
gcgctcttcc 
ggtatcagct 
aaagaacatg 
ggcgtttttc 
gaggtggcga 
cgtgcgctct 
gggaagcgtg 
tcgctccaag 
cggtaactat 
cactggtaac 
gtggcctaac 
agttaccttc 
cggtggtttt 
tcctttgatc 
tttggtcatg 
aagggcctcg 
acgtcaggtg 
atacattcaa 
tgaaaaagga 
gcattttgcc 
gatcagttgg 
gagagttttc 
ggcgcggtat 
tctcagaatg 
acagtaagag 
cttctgacaa 
catgtaactc 
cgtgacacca 
ctacttactc 
ggaccacttc 
ggtgagcgtg 
atcgtagtta 
gctgagatag 
atactttaga 



gataagcttg 
acaccagcga 
taagcgatac 
ccttcttaaa 
agtcgtatta 
gatgacggtg 
gcggatgccg 
ggcgcagcca 
ggcatcagag 
atgcggtgtg 
gcttcctcgc 
cactcaaagg 
tgagcaaaag 
cataggctcc 
aacccgacag 
cctgttccga 
gcgctttctc 
ctgggctgtg 
cgtcttgagt 
aggattagca 
tacggctaca 
ggaaaaagag 
tttgtttgca 
ttttctacgg 
agattatcaa 
tgatacgcct 
gcacttttcg 
atatgtatcc 
agagtatgag 
ttcctgtttt 
gtgcacgagt 
gccccgaaga 
tatcccgtgt 
acttggttga 
aattatgcag 
cgatcggagg 
gccttgatcg 
cgatgcctgt 
tagcttcccg 
tgcgctcggc 
ggtctcgcgg 
tctacacgac 
gtgcctcact 
ttgattt 



ggctgcaggt 
acagcagcag 
cagccagaac 
gttaaacaaa 
atttcgaagt 
aaaacctctg 
ggagcagaca 
tgacccagtc 
cagattgtac 
aaataccgca 
tcactgactc 
cggtaatacg 
gccagcaaaa 
gcccccctga 
gactataaag 
ccctgccgct 
aatgctcacg 
tgcacgaacc 
ccaacccggt 
gagcgaggta 
ctagaaggac 
ttggtagctc 
agcagcagat 
ggtctgacgc 
aaaggatctt 
atttttatag 
gggaaatgtg 
gctcatgaga 
tattcaacat 
tgctcaccca 
gggttacatc 
acgttttcca 
tgacgccggg 
gtactcacca 
tgctgccata 
accgaaggag 
ttgggaaccg 
agcaatggca 
gcaacaatta 
ccttccggct 
tatcattgca 
ggggagtcag 
gattaagcat 



cgactctaga 

aacaaccaga 

accccagtga 

attatttcta. 

ctatcagaag 

acacatgcag 

agcccgtcag 

acgtagcgat 

tgagagtgca 

cagatgcgta 

gctgcgctcg 

gttatccaca 

ggccaggaac 

cgagcatcac 

ataccaggcg 

taccggatac 

ctgtaggtat 

ccccgttcag 

aagacacgac 

tgtaggcggt 

agtatttggt 

ttgatccggc 

tacgcgcaga 

tcagtggaac 

cacctagatc 

gttaatgtca 

cgcggaaccc 

caataaccct 

ttccgtgtcg 

gaaacgctgg 

gaactggatc 

atgatgagca 

caagagcaac 

gtcacagaaa 

accatgagtg 

ctaaccgctt 

gagctgaatg 

acaacgttgc 

atagactgga 

ggctggttta 

gcactggggc 

gcaactatgg 

tggtaactgt 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2560 

2617 



<210> 45 
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<211> 2599 
<212> ADN 

<213> Sequence artif icielle 
<220> 

<223> Description de la sequence artif icielle: vecteur 
d'expression pT7-7-dp-Pt (TME2) 

<400> 45 

aattctcatg tttgacagct tatcatcgat gataagcttg ggctgcaggt cgactctaga 60 
ggatccccgg gcgcgaattc ctaagcttca gcctgagaga tcagcagcat catccacagg 120 
caagagcaaa cacgagcgtc agccagcagc aggaacagca gaacaacgta ttccgggtcc 180 
atatgtatat ctccttctta aagttaaaca aaattatttc tagagggaaa ccgttgtggt 240 
ctccctatag tgagtcgtat taatttcgaa gtctatcaga agttcgaatc gctgggcctc 300 
gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca 360 
gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt 420 
ggcgggtgtc ggggcgcagc catgacccag tcacgtagcg atagcggagt gtatatactg 480 
gcttaactat gcggcatcag agcagattgt actgagagtg caccatagga agate ttccg 540 
gaagatcttc etatgeggtg tgaaataccg cacagatgeg taaggagaaa ataccgcatc 600 
aggegctett ccgcttcctc gctcactgac tcgctgcgct eggtegtteg getgeggega 660 
gcggtatcag ctcactcaaa ggeggtaata eggttatcca cagaatcagg ggataacgea 720 
ggaaagaaca tgtgagcaaa aggecagcaa aaggccagga acegtaaaaa ggccgcgttg 780 
ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg aegctcaagt 840 - 
cagaggtggc gaaacccgac aggacta'taa agataccagg cgtttccccc tggaagctcc 900 
ctcgtgcgct ctcctgttcc gaccctgccg ettaceggat acctgtccgc ctttctccct 960 
tegggaageg tggegcttte teaatgetea cgctgtaggt atctcagttc ggtgtaggtc 1020 
gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta 1080 
teeggtaact ategtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca 1140 
gccactggta acaggattag cagagegagg tatgtaggcg gtgetacaga gttcttgaag 1200 
tggtggccta actaeggcta cactagaagg acagtatttg gtatctgege tetgetgaag 1260 
ccagttacct teggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt 1320 
agcggtggtt tttttgtttg caagcagcag attacgegea gaaaaaaagg atctcaagaa 1380 
gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg 1440 
attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaat tcttgaagac 1500 
gaaagggect cgtgatacgc ctatttttat aggttaatgt catgataata atggtttctt 1560 
agaegtcagg tggcactttt eggggaaatg tgegeggaac ccctatttgt ttatttttct 1620 
aaatacattc aaatatgtat ccgctcatga gacaataacc ctgataaatg cttcaataat 1680 
attgaaaaag gaagagtatg agtattcaac atttccgtgt cgcccttatt cccttttttg 1740 
eggcattttg ccttcctgtt tttgctcacc cagaaacget ggtgaaagta aaagatgctg 18 00 
aagatcagtt gggtgcacga gtgggttaca tcgaactgga tctcaacagc ggtaagatcc 1860 
ttgagagttt tcgccccgaa gaacgttttc caatgatgag cacttttaaa gttctgetat 1920 
gtggcgcggt attatcccgt gttgacgccg ggcaagagca actcggtcgc cgcatacact 1980 
attctcagaa tgacttggtt gagtactcac cagtcacaga aaagcatctt aeggatggea 2040 
tgacagtaag agaattatgc agtgctgcca taaccatgag tgataacact gcggccaact 2100 
tacttctgac aacgategga ggaccgaagg agctaaccgc ttttttgeae aacatggggg 2160 
atcatgtaac tegecttgat cgttgggaac eggagctgaa tgaagecata ccaaacgacg 2220 
agegtgacac cacgatgcct gtagcaatgg caacaaegtt gegcaaacta ttaactggcg 2280 
aactacttac tctagcttcc eggcaacaat taatagactg gatggaggcg gataaagttg 2340 
caggaccact tctgcgctcg gcccttccgg ctggctggtt tattgetgat aaatctggag 2400 
ccggtgagcg tgggtctege ggtatcattg cagcactggg gccagatggt aagccctccc 2460 
gtatcgtagt tatctacacg aeggggagtc aggcaactat ggatgaacga aatagacaga 2520 
tegctgagat aggtgectea ctgattaagc attggtaact gtcagaccaa gtttactcat 2580 
atatacttta gattgattt 2599 



<210> 46 
<211> 271 
<212> PRT 

<213> Sequence artificielle 
<220> 
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<223> Description de la sequence artif icielle: prote'ine 
de fusion GST-DP-TME1 

<400> 46 

Met Ser Pro He Leu Gly Tyr Trp Lys He Lys Gly Leu Val Gin Pro 
1 5 * 10 15 

Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu 
20 25 30 . 

Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu 
35 40 " 45 

Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr He Asp Gly Asp Val Lys 
50 55 60 

Leu Thr Gin Ser Met Ala He He Arg Tyr He Ala Asp Lys His Asn 
65 70 75 80 

Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu He Ser Met Leu Glu 

85. 90 .95 

Gly Ala Val Leu Asp He Arg Tyr Gly Val Ser Arg He Ala Tyr Ser 
100 105 110 

Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu 
115 120 125 

Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn 
130 135 140 

Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp 
145 150 1S5 160 

Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu 
165 170 175 

Val Cys Phe Lys Lys Arg He Glu Ala He Pro Gin He Asp Lys Tyr 
180 185 190 

Leu Lys Ser Ser Lys Tyr He Ala Trp Pro Leu Gin Gly Trp Gin Ala 
195 200 205 

Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Leu Ser Gly Gly 
210 215 220 

Gly Gly Gly Leu Val Pro Arg Gly Ser Asp Pro He Ala Gly Ala His 
225 230 235 240 

Trp . Gly Val Leu Ala Gly He Ala Tyr Phe Ser Met Val Gly Asn Trp 
245 250 255 

Ala Lys Val Leu Val Val Leu Leu Leu Phe Ala Gly Val Asp Ala 
260 265 270 



<210> 47 
<211> 265 
<212> PRT 

<213> Sequence artificielle 
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<220> 

<223> Description de la sequence artif icielle : prot^ine 
de fusion GST-DP -TME2 

<400> 47 

Met Ser Pro lie Leu Gly Tyr Trp Lys lie Lys Gly Leu Val Gin Pro 
15 10 IS 

Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu 
20 25 30 

Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu 
35 40 45 

Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr lie Asp Gly Asp Val Lys 
50 55 60 

Leu Tftur Gin Ser Met Ala He lie Arg Tyr lie Ala Asp' Lys His Asn 

65 70 75 80 

* 

Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu He Ser Met Leu Glu 
85 90 . * 95 

Gly Ala Val Leu Asp He Arg Tyr Gly Val Ser Arg He Ala Tyr Ser 
100 105. 110 

Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu 
115 120 125 

Met Leu Lys Met Phe Glu Asp Arg. Leu Cys His Lys Thr Tyr Leu Asn 
130 135 140 

Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp 
145 150 155 160 

Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu 
165 170 175 

Val Cys Phe Lys Lys Arg He Glu Ala He Pro Gin He Asp Lys Tyr 
180 185 190 

Leu Lys Ser Ser Lys Tyr He Ala Trp Pro Leu Gin Gly Trp Gin Ala 
195 200 205 

Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Leu Ser Gly Gly 
210 215 220 

Gly Gly Gly Leu Val Pro Arg Gly Ser Asp Pro Glu Tyr Val Val Leu 
225 230 235 240 

Leu Phe Leu Leu Leu Ala Asp Ala Arg Val Cys Ser Cys Leu Trp Met 
245 250 * 255 

Met Leu Leu He Ser Gin Ala Glu Ala 
260 265 



<210> 48 
<211> 170 
<212> PRT 

<213> Sequence artif icielle 
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<220> 

<223> Description de la sequence artif icielle : proteine 
de fusion TrX-DP.-TMEl 

<400> 48 

Met Ser Asp Lys lie lie His Leu Thr Asp Asp Ser Phe Asp Thr Asp 
15 10 15 

* T «1 L*u Lys Ala Asp Gly Ala He Leu Val Asp Phe Trp Ala Glu Trp 
20 25 30 

Cye Gly Pro Cys Lys Met He Ala Pro He Leu Asp Glu He Ala Asp 
35 40 45 

ulu Tyr Gin Gly Lys Leu Thr Val Ala Lys Leu Asn He Asp Gin Asn 
50 55 60 

i6 Gly Thr Ala Pro X«s Tyr Gly He Arg Gly lie Pro Thr Leu Leu 
55 ^70 75 80 

L«u Phe Lys Asn Gly Glu Val Ala Ala Thr Lys Val Gly Ala Leu Ser 
85 90 95 . 

Lys Gly Gin Leu Lys Glu Phe Leu Asp Ala Asn Leu Ala Gly Ser Gly 
100 105 110 

Ser Gly Ser Pro Lys Ser Asp Leu Ser Gly Gly Gly Gly Gly Leu Val 
115 120 125 

Pro Arg Gly Ser Asp Pro He Ala Gly Ala His Trp Gly Val Leu Ala 
130 135 140 

Gly He Ala Tyr Phe Ser Met Val Gly Asn Trp Ala Lys Val Leu Val 
145 150 155 160 

Val Leu Leu Leu Phe Ala Gly Val Asp Ala 
165 170 



<210> 49 
<211> 161 
<212> PRT 

<213> Sequence artif icielle 
<220> 

<223> Description de la sequence artif icielle: proteine 
de fusion TrX-DP-TME2 

<400> 49 

Met Ser Asp Lys He He His Leu Thr Asp Asp 
15 10 

Val Leu Lys Ala Asp Gly Ala He Leu Val Asp 
20 25 

Cys Gly Pro Cys Lys Met He Ala Pro He Leu 
35 40 

Glu Tyr Gin Gly Lys Leu Thr Val Ala Lys Leu 
50 55 



Ser Phe Asp Thr Asp 
15 

Phe Trp Ala Glu Trp 
30 

Asp Glu He Ala Asp 
45 

Asn He Asp Gin Asn 
60 
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Pro Gly Thr Ala Pro Lys Tyr Gly He Arg Gly lie Pro Thr Leu Leu 
65 70 75 80 

Leu Phe Lys Asn Gly Glu Val Ala Ala Thr Lys Val Gly Ala Leu Ser 
85 90 95 

Lys Gly Gin Leu Lys Glu Phe Leu Asp Ala Asn Leu Ala Gly Ser Gly 
100 105 110 

Ser Gly Ser Asp Leu Ser Gly Gly Gly Gly Gly Leu Val Pro Arg Gly 
115 120 125 

Ser Asp Pro Glu Tyr Val Val Leu Leu Phe Leu Leu Leu Ala Asp Ala 
130 135 140 

Arg Vai Cys Ser Cys Leu Trp Met Met Leu Leu He Ser Gin Ala Glu 
145 - 150 , 155 160 

Ala • • 



<210> 50 
<211> 39 
<212> PRT 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: proteine 
de fusion M-DP-TME1 

<400> 50 

Met Asp Pro He Ala. Gly Ala His Trp Gly Val Leu Ala Gly He Ala 
1 5 10 15 

Tyr Phe . Ser Met Val Gly Asn Trp Ala Lys Val Leu Val Val Leu Leu 
20 25 30 

Leu Phe Ala Gly Val Asp Ala 
35 



<210> 51 
<211> 33 
<212> PRT 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: proteine 
de fusion M-DP-TME2 

<400> 51 

Met Asp Pro Glu Tyr Val Val Leu Leu Phe Leu Leu Leu Ala Asp Ala 
15 10 15 

Arg Val Cys Ser Cys Leu Trp Met Met Leu Leu He Ser Gin Ala Glu 
20 25 30 

Ala 



28 



WO 2004/027068 ^CT/FR2003/002763 



<210> 52 
<2X1> 239 
<212> PRT 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 
glutathion transferase (OST) 

<400> 52 

Met Ser Pro He Leu Gly Tyr Trp Lys He Lys Gly Leu Val Gin Pro 
15 10 15 

Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu 
20 25 30 

Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu 
35 40 45 

Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr He Asp Gly Asp Val Lys 

50 55- .60 

Leu Thr Gin Ser Met Ala He He Arg Tyr He Ala Asp Lys His Asn 
65 70 75 80 

Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu He Ser Met Leu Glu 
85 90 95 

Gly Ala Val Leu Asp He Arg Tyr Gly Val Ser Arg He Ala Tyr Ser 
100 105 110 

Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu 
115 120 125 

Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn 
130 135 140 

Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp 
145 150 155 160 

Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu 
165 170 175 

Val Cys Phe Lys Lys Arg He Glu Ala He Pro Gin He Asp Lys Tyr 
180 185 190 

Leu Lys Ser Ser Lys Tyr He Ala Trp Pro Leu Gin Gly Trp Gin Ala 
195 200 205 

Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Leu Ser Gly Gly 
210 215 220 

Gly Gly Gly Leu Val Pro Arg Gly Ser Pro Gly He His Arg Asp 
225 230 235 



<210> 53 
<211> 170 
<212> PRT 



29 



WO 2004/027068 PCT7FR2003/002763 



<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 
thior§doxine (TrX) 

<400> 53 

Met Ser Asp Lys lie lie His Leu Thr Asp Asp Ser Phe Asp Thr Asp 
1 5 10 15 

Val Leu Lys Ala Asp Gly Ala lie Leu Val Asp Phe Trp Ala Glu Trp 
20 25 30 

Cys Gly Pro Cys Lys Met lie Ala Pro lie Leu Asp Glu lie Ala Asp 
35 40 45 

Glu Tyr Gin Gly Lys Leu Thr Val Ala Lys Leu Asn lie Asp Gin Asn 
50 55 60 ^ 

Pro Gly Thr Ala Pro Lys Tyr Gly lie Arg Gly lie Pro Thr Leu Leu 
65 70 # 75 60 

Leu Phe Lys Asn Gly Glu Val Ala. Ala Thr Lys Val Gly Ala Leu Ser 
85 90 95 

Lys Gly Gin Leu Lys Glu Phe Leu Asp Ala Asn Leu Ala Gly Ser Gly 
100 105 110 

Ser Gly Ser Pro Lys Ser Asp Leu Ser Gly Gly Gly Gly Gly Leu Val 
115 120 125 

Pro Arg Gly Ser Asp Pro He Ala Gly Ala His Trp Gly Val Leu Ala 
130 135 . 140 

Gly He Ala Tyr Phe Ser Met Val Gly Asn Trp Ala Lys Val Leu Val 
145 150 155 160 

Val Leu Leu Leu Phe Ala Gly Val Asp Ala 
165 170 
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